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OM nucleic - nucleic search, using sw model 



Run on: 



January 22, 2005, 07:16:57 ; Search time 5792.24 Seconds 

(without alignments) 
11720.367 Million cell updates/sec 



Title: 

Perfect score: 
Sequence: 



US-10-054-680-3 
1863 

1 atggcgtggttaaggttgca. 



. ggaaagccagtattgggtga 1863 



Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 

Searched: 32822875 seqs, 18219865908 residues 

Total number of hits satisfying chosen parameters: 65645750 



Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 

Database : EST:* 
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gb_estl : * 
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gb_est2 : * 
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gb_htc: * 
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gb_est3:* 
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gb_est4 : * 
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gb est5:* 
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gb_est6: * 
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gb_gssl : * 
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gb_gss2 : * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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RESULT 1 
AY401283 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



AY401283 1788 bp DNA linear GSS 15-DEC-2003 

Homo sapiens SLC8A3 gene, VIRTUAL TRANSCRIPT, partial sequence,, 
genomic survey sequence. 
AY401283 

AY401283.1 GI:39757272 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1788) 

Clark, A. G. , Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 



Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
TITLE Inferring nonneutral evolution from human- chimp-mouse orthologous 

gene trios 

JOURNAL Science 302 (5652), 1960-1963 (2003) 
PUBMED 14671302 
REFERENCE 2 (bases 1 to 1788) 

AUTHORS Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T.J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
TITLE Direct Submission 

JOURNAL Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 
COMMENT This sequence was made by sequencing genomic exons and ordering 

them based on alignment. 
FEATURES Location/Qualifiers 
source 1. .1788 

/organism="Homo sapiens" 
/mo l_type= 11 genomic DNA" 
/db_xref="taxon: 9606" 
gene <1. .>1788 

/gene="SLC8A3" 
/locus_tag="HCM0839 n 

ORIGIN 

Query Match 95.8%; Score 1784.4; DB 9; Length 1788; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 AC AGGGC AGAACAAT GAGT CCT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CATCCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AC AGGG CAGAACAAT GAGT CCT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 180 

Qy 181 CCAAT CT GGT AC C CGGAGAACC CTT C C CT T GGGGACAAGAT TGCCAGGGT CATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301' T CT ATT GAAGT CATC ACCT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC CCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 T CT AT TGAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAAC CCAAT GGAGAA 360 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 361 ACC AGCACAAC CACT ATT C GGGT CT GGAAT GAAACT GT CT C CAACCT GACC CTT AT GGC C 420 



t 



Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 AT T GCT GGT GAT CT GGGACCTT CT AC CATTGT AGGGAGT GCAGC CTT CAACAT GT T CAT C 540 

Qy 541 AT C AT TGGCAT CT GT GT CT ACGTGAT CCCAGACGGAGAGACTCGCAAGAT CAAGCAT CTA 600 

I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 ATCATTGGCATCTGT GTCTACGTGATCCCAGACGGAGAGACTCGCAAGAT CAAGCATCTA 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GCACAAAAAGT AC CGC ACAGACAAACACC GAGGAATT AT CATAGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AT GCACAAAAAGT AC CGC ACAGACAAACACC GAGGAAT TAT CATAGAGACAGAGGGT GAC 840 

Qy 841 C AC CCT AAGGGC AT T GAGAT GGAT GGGAAAAT GATGAAT T C CCATT TT CTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I U I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CACCCTAAGGGCATT GAGATGGAT GGGAAAAT GATGAATTCCCATTTT CTAGATGGGAAC 900 

Qy 901 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT CC C GC AGAGAGAT GAT C C GGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I II I I 
Db 901 CT GGT GC C CCT G GAAGGGAAGGAAGT GGAT GAGT CC C GC AGAGAGAT GAT C C GGATT CT C 960 

Qy 961 AAGGAT CT GAAGCAAAAACAC CCAGAGAAGGACT TAGAT CAGCTGGTGGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGGAT CT GAAGCAAAAACACC CAGAGAAGGACT TAGAT CAGCT GGT GGAGAT GGCCAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TACT AT GCT CTT T C CC AC CAAC AGAAGAGCCGC GCCTT CT ACC GT AT C CAAGC CACT C GT 1080 

Qy 1081 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGC AGAACAAGCCAAGAAGGCC 114 0 

Qy 1141 T C CAGCAT GAGCGAGGT GCACACC GAT GAGC CT GAGGACT TT ATT T C CAAGGT CT TCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 T C CAGCAT GAGCGAGGT GCACACC GAT GAGCCT GAGGACTTTATT T CCAAGGT CTTCTTT 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 GAC CC AT GT T CT TAC CAGT GC CTGGAGAACT GT GGGGCT GT ACT C CT GACAGT GGT GAGG 1260 



Qy 

Db 



1261 
1261 



AAAGGGGGAGAC AT GT CAAAGACC AT GTAT GT GGACT ACAAAACAGAGGAT GGT T CT GC C 
I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAAGGGGGAGAC AT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGTT CT GC C 



1320 
1320 



Qy 1321 AAT GCAGGGGCT GACT ATGAGT TC ACAGAGGGCACGGTGGTT CT GAAGCCAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 AAT GCAGGGGCT GACT ATGAGT T C AC AGAGGGCAC GGTGGT T CT GAAGC C AGGAGAGACC 1380 

Qy 1381 CAGAAGGAGT T CT C C GT GGGC AT AAT T GAT GACGACATTT T T GAGGAGGAT GAACACTT C 1440 

I I I I I I II I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1381 CAGAAGGAGT T CT C C GT GGGC ATAATT GAT GACGACATTT T T GAGGAGGAT GAACACTT C 1440 

Qy 1441 T T T GTAAGGT T GAGCAATGT C CGCAT AGAGGAGGAGCAGC CAGAGGAGGGGAT GCCT CC A 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GT T AC CATCT T GGAT GAT GACCAT GCAGGCAT CT T C ACT TTT GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GT T AC C AT CT T GGAT GATGAC CAT GCAGGCAT CTT C ACT T TT GAAT GT GAT ACT AT T CAT 1620 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I II I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GT CAGT GAGAGT AT T GGT GT T AT GGAGGT CAAGGT T CTGC GGACAT CAGGT GCCCGGGGT 1680 

Qy 1681 AC AGT CATC GT C CC CTTT AGGACAGT AGAAGGGAC AGCCAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

Qy 1741 GAAGACACATAT GGGGAGTT GGAATTCAAGAATGATGAAACTGT AT 1786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GAAGACACATAT GGGGAGT T GGAATT CAAGAATGAT GAAACT GT GT 1786 



RESULT 2 
BC036783 
LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



BC036783 3186 bp mRNA linear HTC 19-NOV-2003 

Homo sapiens solute carrier family 8 (sodium-calcium exchanger), 
member 3, mRNA (cDNA clone IMAGE: 5732743) , with apparent retained 
intron . 
BC036783 

BC036783.1 GI: 23331089 
HTC. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 3186) 

Strausberg, R. L. , Feingold, E. A. , Grouse, L.H. , Derge, J.G. , 
Klausner, R. D. , Collins, F. S . , Wagner, L. , Shenmen, C .M. , Schuler , G. D. , 
Altschul, S . F. , Zeeberg,B., Buetow,K.H., Schaef er, C. F. , Bhat,N.K., 
Hopkins, R. F. , Jordan, H., Moore, T., Max, S.I. , Wang, J., Hsieh,F., 
Diatchenko, L. , Marusina,K., Farmer, A. A., Rubin, G.M., Hong,L., 
Stapleton,M. , Scares , M. B . , Bonaldo,M.F. , Casavant,T . L. , 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



REMARK 
COMMENT 



Scheetz, T . E. , Browns tein,M. J. , Usdin, T. B. , Toshiyuki, S . , 
Carninci,P., Prange,C, Raha,S.S., Loquellano, N . A. , Peters, G. J., 
Abramson, R. D. , Mullahy, S . J. , Bosak, S.A. , McEwan, P. J. , 
McKernan, K. J. , Malek, J. A. , Gunaratne, P.H. , Richards, S. , 
Worley,K.C, Hale,S., Garcia, A.M., Gay,L.J., Hulyk,S.W., 
Villalon, D. K. , Muzny, D.M. , Sodergren, E. J. , Lu,X., Gibbs,R.A., 
Fahey,J., Helton, E., Ketteman, M. , Madan,A. , Rodrigues , S . , 
Sanchez, A., Whiting, M., Madan,A., Young, A. C, Shevchenko, Y. , 
Bouffard, G.G. , Blakesley, R. W. , Touchman, J. W. , Green, E.D. , 
Dickson, M.C. , Rodriguez, A. C . , Grimwood, J. , Schmutz,J., Myers, R.M., 
Butter f ield, Y. S . , Krzywinski,M. I . , Skalska,U . , Smailus, D. E. , 
Schnerch,A., Schein,J.E., Jones, S.J. and Marra,M.A. 
Generation and initial analysis of more than 15,000 full-length 
human and mouse cDNA sequences 

Proc. Natl. Acad. Sci. U.S.A. 99 (26), 16899-16903 (2002) 

22388257 

12477932 

2 (bases 1 to 3186) 
Strausberg, R. 
Direct Submission 

Submitted (23-AUG-2002 ) National Institutes of Health, Mammalian 
Gene Collection (MGC) , Cancer Genomics Office, National Cancer 
Institute, 31 Center Drive, Room 11A03, Bethesda, MD 20892-2590, 
USA 

NIH-MGC Project URL: http://mgc.nci.nih.gov 
Contact: MGC help desk 
Email : cgapbs-r@mail . nih . gov 
Tissue Procurement: Invitrogen 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: National Institutes of Health Intramural 

Sequencing Center (NISC) , 

Gaithersburg, Maryland; 

Web site: http://www.nisc.nih.gov/ 

Contact: nisc_mgc@nhgri .nih.gov 

Akhter,N. , Ayele, K. , Beckstrom-Sternberg, S .M. , Benjamin, B. , 
Blakesley, R.W. , Bouf f ard, G. G. , Breen,K., Brinkley,C, Brooks, S., 
Dietrich, N.L. , Granite, S., Guan,X., Gupta, J., Haghighi,P., 
Hansen, N., Ho,S.-L., Karlins,E., Kwong,P., Laric,P., Legaspi,R., 
Maduro,Q.L., Masiello,C. , Maskeri,B. , Mastrian, S . D . ,McCloskey, J. C. 
McDowell, J., Pearson, R., Stantripop, S . , Thomas, P.J. , Touchman, J. W. 
Tsurgeon,C, Vogt,J.L., Walker, M. A., Wetherby, K. D . , Wiggins, L., 
Young, A. , Zhang, L.-H. and Green, E.D. 



Clone distribution: MGC clone distribution information can be found 
.-through the I.M.A.G.E. Consortium/ LLNL at: http://image.llnl.gov 
Series: IRAK Plate: 79 Row: j Column: 21 

This clone was selected for full length sequencing because it 
passed the following selection criteria: matched mRNA gi: 17865803 
This clone has the following problem: retained intron. 
FEATURES Location/Qualifiers 
source 1. .3186 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/clone=" IMAGE: 5732743" 

/tissue_type="Brain, hippocampus" 



/clone_lib="NIH_MGC_124" 
/lab_host="DH10B" 
/note="Vector: pCMV-SP0RT6" 

ORIGIN 

Query Match 95.7%; Score 1783; DB 3; Length 3186; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 558 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 617 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 618 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 677 

Qy 121 ACAGGGC AGAACAAT GAGT CCT GTT CAGGGT C AT CGGACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 678 ACAGGGC AGAACAAT GAGT C CT GTT CAGGGTC AT CGGACT GCAAGGAGGGT GT CAT CCT G 737 

Qy 181 C CAAT CTGGT AC C CGGAGAAC C CTT CC CTT GGGGACAAGATT GCCAGGGT CAT T GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 738 C CAAT CT GGT AC C CGGAGAAC C CTT C C CTT GGGGACAAGATT GCCAGGGT C ATTGT CT AG 797 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 798 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 857 

Qy 301 T CT ATTGAAGTCAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 858 T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAAT T AAGAAACCCAAT GGAGAA 917 

Qy 361 ACC AGCACAAC CACT AT T C GGGTCT GGAAT GAAACTGT CT C CAAC CT GAC CCT TAT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II 
Db 918 ACC AGCACAAC C AC TAT T C GGGT CT GGAAT GAAACTGT CT C CAAC CT GACCCTT AT GGCC 977 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 978 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1037 

Qy 481 ATT G CT GGT GAT CT GGGAC CTT CT AC CAT T GT AGGGAGT GC AGCCT T CAACAT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1038 ATT GCT GGT GAT CT GGGACCTT CT AC CAT T GT AGGGAGT GCAGCCT T CAACAT GTT CAT C 1097 

Qy 541 AT CAT T GGCAT CT GT GT CT AC GTGAT C CCAGACGGAGAGACT C GCAAGAT CAAGC AT CT A- 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1098 AT C ATT GGCAT CT GT GT CT AC GT GAT C CCAGACGGAGAGACT C GCAAGAT CAAGCAT CTA 1157 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1158 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1217 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1218 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1277 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I II I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I 
1278 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1337 



781 



1338 



841 



AT GCACAAAAAGT AC CGC ACAGACAAACACCGAGGAATT AT CAT AGAGACAGAGGGT GAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
AT GCACAAAAAGT ACCGCACAGACAAAC AC CGAGGAAT TAT CAT AGAGACAGAGGGT GAC 



840 



1397 



900 



CACCCTAAGGGCATTGAGATGGATGGGAAAATGAT GAATTCCCATTTT CTAGATGGGAAC 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
1398 CAC CCTAAGGGCAT T GAGATGGAT GGGAAAAT GAT GAAT T CCCATTT T CT AGAT GGGAAC 1457 



901 



960 



CT GGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGTCCC GCAGAGAGAT GAT C C GGATT CT C 

I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1458 CT GGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGTCCC GCAGAGAGAT GAT CC GGATT CT C 1517 

961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAAT 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1518 AAGGAT CT GAAGCAAAAAC AC CCAGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGCCAAT 1577 

1021 T ACT ATGCT CT TT C C CAC CAACAGAAGAGCCGCGCCT T CT ACC GTAT CCAAGCCACT C GT 1080 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
1578 TACT ATGCT CT TT C C CAC CAACAGAAGAGCCGC GCCT T CT ACCGTAT C CAAGCCACT C GT 1637 

1081 AT GAT GACT GGT G CAGGCAAT AT C CT GAAGAAAC AT GCAGC AGAACAAGC CAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1638 AT GAT GACTGGT G CAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGCC 1697 

1141 T C C AGCAT GAGC GAGGTGCAC AC C GAT GAGCCT GAGGACTTT AT TT C CAAGGT CTT CT TT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1698 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1757 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1758 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1817 

1261 AAAGGGGGAGACAT GT CAAAGACC AT GTAT GT GGACT ACAAAAC AGAGGAT GGT T CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1818 AAAGGGGGAGACAT GT CAAAGACC AT GTAT GT GGACT ACAAAAC AGAGGAT GGT T CT GCC 1877 

1321 AAT GCAGGGG CT GACT AT GAGTT CAC AGAGGGCAC GGT GGTT CT GAAGC CAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1878 AAT GCAGGGGCT GACT AT GAGT T CAC AGAGGGCAC GGT GGTTCT GAAGC CAGGAGAGAC C 1937 

1381 CAGAAGGAGTTCT CCGTGGGCATAATTGAT GACGACATTTTTGAGGAGGAT GAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1938 CAGAAGGAGTT CTCCGTGGGCATAATT GAT GACGACATTTTTGAGGAGGAT GAACACTTC 1997 

1441 TT T GTAAGGTT GAGCAAT GTC C GC AT AGAGGAGGAGCAGC CAGAGGAGGGGAT GC CT CCA 1500 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1998 TT T GTAAGGTT GAGCAAT GTC C GC AT AGAGGAGGAGCAGC C AGAGGAGGGGATGCCT C CA 2057 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
2058 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2117 

1561 GT T AC CAT CT T G GAT GAT GAC CAT G CAGGCAT CTT CACT T TTGAAT GT GAT ACT ATT CAT 1620 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2118 GTT AC C AT CTTGGAT GATGAC CAT GCAGGC AT CTTC ACT TT TGAAT GT GAT ACTATT CAT 2177 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1621 GT C AGT GAGAGT ATT GGT GT T ATGGAGGT CAAGGTT CT GCGGAC AT CAGGT GCCC GGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I 
2178 GT C AGT GAGAGT ATT GGTGTT ATGGAGGT CAAGGTT CT GC GGACAT CAGGT GCC CGGGGT 2237 

1681 AC AGT CAT C GTC CCCTTT AGGACAGT AGAAGGGACAGC CAAGGGT GGCGGT GAGGACTT T 1740 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2238 AC AGT CAT C GTCCC CTTT AGGACAGT AGAAGGGACAGC CAAGGGT GGC GGT GAGGACT T T 2297 

1741 GAAGACACAT ATGGGGAGTTGGAATT CAAGAAT GATGAAACTGTATGTGACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

2298 GAAGACACAT ATGGGGAGTTGGAATTCAAGAATGATGAAAC T GT GAAAAC C AT AAG 2353 

1801 GCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGC AGAGA 1841 

I I I II I III I I I I Ml I I I I I I I 

2354 GGT TAAAAT AGT AGAT GAGGAGGAAT ACGAAAGGCAAGAGA 2394 
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AY401284 1788 bp DNA linear GSS 15-DEC-2003 

Pan troglodytes SLC8A3 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY401284 

AY401284. 1 GI: 39757273 
GSS. 

Pan troglodytes (chimpanzee) 
Pan troglodytes 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Pan. 

1 (bases 1 to 1788) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Kej ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T . J. , Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 1788) 

Clark, A. G. , Glanowski, S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B. , 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .1788 

/organism= M Pan troglodytes" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9598" 
<1. .>1788 



/gene="SLC8A3" 
/locus_tag="HCM0839" 

ORIGIN 

Query Match 93.4%; Score 1739.4; DB 9; Length 1788; 

Best Local Similarity 97.8%; Pred. No. 0; 

Matches 1746; Conservative 0; Mismatches 40; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I 
Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 T TT GT GCTCT TC CT GAAT GGT CTT C GAGCAGAGGCT GGT GGCT CAGGGGAC GT GCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TTTGTGCTCTTTCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 AC AGGGC AGAACAAT GAGT CCT GTT C AGGGT CAT CGGACT GCAAGGAGGGT GT C AT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AC AGGGC AGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT C CT G 180 

Qy 181 C CAATCT GGT ACCCGGAGAAC CCTT C C CTT GGGGACAAGATT GC CAGGGT CATT GT CTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 181 C CAATCT GGT AC CCGGAGAACCCTT C C CTT GGGGACAAGATT GC CAGGGT CAT T GT CTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCG 300 

Qy 301 TCTATT GAAGTCATCACCTCTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 360 

I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 T CT ATT GAAGTC AT C ACCT CT CAAGAGAGGGAGGT GAC GATTAAGAAACCCAAT GGAGAA 360 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ACC AGC ACAACC ACT ATT C GAGT CT GGAAT GAAACT GT CT CCAACCT GAC CCTT AT GGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 ATT GCT GGT GAT CTGGGAC CT T CT ACCAT T GT AGGGAGT GCAGC CTT GAACAT GTT CAT C 540 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 AT T GCT GGT GAT CT GGGAC CT T CT AC CAT T GT AGGGAGT GCAGC CTT CAACAT GTT CAT C 540 

Qy 541 AT C ATT GGCAT CT GT GT CT AC GTGAT CC C AGACGGAGAGACT CGCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 541 AT CATT G GC AT CT GT GT CT ACGT GAT CCC AGACGGAGAGACT CGCAAGAT CAAGCAC CT A 600 

Qy 601 C GAGT CT TCT TC AT CAC CGCT GCT T GGAGT AT CT T T GC CT ACAT CTGGCT CTAT AT GATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 



Qy 



721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 



Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

I I I I I I I I I I I I t I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 ATGCACAAAAAGTACCGCACAGATAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

841 C AC C CTAAGGGC ATT GAGATGGAT GGGAAAAT GAT GAATT CCCATTTT CT AGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I II I II 
841 CAC C CTAAGGGC ATT GAGATGGAT GGGAAAAT GAT GAATT CC CAT TTT CTAGAT GGGAAC 900 

901 CT GGT GCC C CT GGAAGGGAAGGAAGT GGAT GAGT C CC GC AGAGAGAT GAT CC GGAT TCT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I 
901 CT GGT GCC C CT GGAAGGGAAGGAAGT GGAT GAGT C CC GC AGAGAGAT GAT CC GGAT TCT C 960 

961 AAGGAT CT GAAGCAAAAACAC C CAGAGAAGGACT T AGAT C AGCT GGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I- 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml 
961 AAGGAT CT GAAGCAAAAACAC C C AGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGCTAAT 1020 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
1021 TACT AT GCT CT T T CCC AC CAACAGAAGAGC C GCGCCT T CT ACC GGAT C CAAGC CACTCGT 1080 

1081 AT GAT GACT GGT GC AGGCAAT ATCCT GAAGAAACATGCAGCAGAACAAGC CAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 AT GAT GACT GGT GCAGGC AAT AT C CT GAAGAAACATGCAGCAGAACAAGC CAAGAAGGC C 1140 

1141 T C CAGCAT GAGC GAGGT GC AC ACCGAT GAGC CT GAGGACT TT ATTT C CAAGGT CTT CTT T 1200 

I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 TCCAGCATGANNGAGGTGCACACCGATGANNCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I II I J I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 GACCCATGTTCTTACCAATGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

1261 AAAGGGGGAGACAT GTCAAAGACCAT GTAT GT GGACTACAAAACAGAGGATGGTTCTGCC 1320 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
1261 AAAGGGGGAGACAT GTCAAAGACCAT GTAT GT GGACTACAAAACAGAGGATGGTNNNGCC 1320 

1321 AAT GC AGGGGCT GACT AT GAGTT CACAGAGGGC AC GGT GGTT CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I II I I I 
1321 AATGCAGGGGCT GACTAT GAGTT CACAGAGGGCACGGTGGTT CTGAAGCCAGGAGAGACC 1380 

1381 C AGAAGGAGT T CT C CGT GGGCAT AATT GAT GAC GACATTT TT GAGGAGGAT GAACACTT C 1440 

II I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 C AGAAGGAGTT CT C CGT AGGCATAATTNNN GAC GACATTTNNNAGGAGGAT GAACACTTN 1440 

1441 TTT GTAAGGT T GAGCAAT GT C C GC ATAGAGGAGGAGCAGC CAGAGGAGGG GAT GC CT C CA 1500 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I 
1441 NNNNNAAGGTT GAGCAAT GTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GNCTCCA 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I II I I I I I I I II I I I I I II I I I I I II I I I I I I I I I I II I I I I I I I I I I I I 

1501 GCAATANNCAACAGTNNNNCCTTGCCTCGGGCTGTNNTAGCCTCCCCTTGTGTNGCCACA 1560 

1561 GTT AC CAT CTT GGAT GAT GAC CAT GCAGG CAT CTT CACTT TT GAAT GT GAT ACT AT T CAT 1620 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1561 GT T AC CAT CTT GGAT GAT GAC CAT GCAGGC AT CTT C ACTTTT GAAT GT GAT ACT AT T CAT 1620 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

Qy 1681 ACAGT CAT CGTCCCCTT TAGGAC AGT AGAAGGGACAGCCAAGGGTGGC GGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I II I I I I I I I ! I I I I I I II I I I I I I I I I 1 I I I I I I I I I I I I I I I I 
Db 1681 ACAGT CAT CGT C CC CT TT AGGAC AGT AGAAGGGACAGC CAAGGGT GGCGGT GAGGACTTT 1740 

Qy 1741 GAAGAC ACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACTGT AT 1786 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1741 GAAGAC ACAT AT GGGGAGTT GGAAT T CAAGAAT GAT GAAACT GT GT 1786 
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AY401285 1788 bp DNA linear GSS 15-DEC-2003 

Mus musculus SLC8A3 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY401285 

AY401285.1 GI: 39757274 
GSS. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Mus. 

1 (bases 1 to 1788) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., . Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 1788) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T . J. , Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .1788 

/organism="Mus musculus" 

/mol_type=" genomic DNA" 

/db_xref="taxon: 10090" 

<1. .>1788 

/gene="SLC8A3" 

/ 1 o cu s_t a g= " HCM0 8 3 9 " 



Query Match 



82.9%; Score 1544.4; DB 9; Length 1788; 



Best Local Similarity 91.5%; Pred. No. 0; 

Matches 1635; Conservative 0; Mismatches 151; Indels 0; Gaps 0; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1 ATGGCGTGGTTACGGCTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACT 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I II I I I I I II 
Db 61 TTTGTGCTCTTCCTGAATTGTCTTCGAGCAGAGGCTGGTGACTCGGGGGATGTGCCCAGT 120 

Qy 121 ACAGGGC AGAACAATGAGT C CT GTT CAGGGTCAT CGGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I II I I II I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 121 GCAGGGCAGAACAATGAGT CCT GTT CGGG GT CAT CAGACT GCAAGGAGGGT GT CATTTT G 180 

Qy 181 CCAAT CT GGTAC C CGGAGAAC C CTT CC CTT GGGGACAAGATT GCCAGGGT CATT GT CT AT 240 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAAT CT GGTAT C CAGAGAAC C CTT CC CTT GGGGACAAGATT GCCAGGGT CATT GT CT AT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I HI I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TTT GT GGC C CT GAT AT AC ATGTTT CTT GGGGT GT CT AT CATT GCT GAC CGATT C AT GGCA 300 

Qy 301 T CTATT GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 360 

I I I I I I I II I II I I II II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 301 T CTATTGAAGT CATTACTTCCCAAGAGAGGGAAGTGACCATCAAGAAGCCCAATGGAGAG 360 

Qy 361 ACCAGCACAAC CACT ATT C GGGTCT GGAAT GAAACTGT CT C CAAC CT GACC CT TAT GGC C 420 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I .MINI 
Db 361 ACCAGCACAACT ACAATT CGGGT AT GGAAT GAAACTGT CT C CAAT CT GACC CT GAT GGC C 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGCTCTTCTGCTCCAGAGATTCTCCTGTCTTTAATTGAGGTGTGTGGTCACGGGTTC 480 

Qy 481 ATT GCT GGT GAT CT GGGAC CT T CT AC CATT GT AGGGAGT GC AGCCTT CAAC AT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I II I I I I I I I I I I I I I I I I I I I I I 
Db 481 ATT GCT GGT GAT CT GGGAC CAT CT AC CAT CGT T GGCAGT GC AGCCTT CAAC AT GT T CAT C 540 

Qy 541 AT CATT GGC AT CT GT GT CT AC GT GAT CCCAGAC GGAGAGACT CGCAAGAT CAAGC AT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II 
Db 541 AT CATT GGCAT CT GT GT CT AT GT GAT CCCAGAT GGGGAGACT C GAAAGAT CAAGCACCT G 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CGAGTCTTCTTCGTCACGGCTGCTTGGAGCATCTTCGCCTACATTTGGCTCTATATGATC 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCTCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTTACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TTTCCCGTGTGTGTCCTGCTGGCTTGGGTGGCAGATAAGCGACTGCTCTTCTACAAATAC 780 

Qy 781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 



781 ATGCACAAAAAATACCGCACAGATAAACACCGAGGAATTATCATTGAGACAGAGGGTGAC 840 

841 CAC CCT AAGGGCATTGAGATGGAT GGGAAAAT GAT GAATT CCCATT TT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I 
841 CACCCTAAGGGCATTGAGATGGAT GGGAAAAT GAT GAATT CTCACTTTCTAGATGGGAAC 900 

901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

901 TTT ACAC CTTT GGAAGGAAAGGAGGT AGAT GAAT CT CGC AGGGAAAT GAT C CGGAT T CT A 960 

961 AAGGAT CT GAAGCAAAAAC AC CCAGAGAAGGACTT AGAT CAGCTGGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I 
961 AAGGAT CT GAAACAAAAAC AC CCAGAAAAGGAC CT AGAT CAGCTGGT GGAGAT GGC CAAT 1020 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II 
1021 TACT AT GCT CTT T C CCAT CAACAGAAGAGC C GT GCTTT CT AC C GCAT CCAAGC CAC CC GG 1080 

1081 ATGATGACTGGTGCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I II 
1081 AT GAT GACT GGT GCGGGCAAT ATACTTAAGAAGC ATGC AGCC GAGCAAGCCAAGAAGAC C 1140 

1141 T CC AGC AT GAGC GAGGT GC AC AC C GAT GAGCCT GAGGACTTT ATT T CCAAGGT CT T CT TT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1141 T CC AGCAT GAGC GAGGT GCAT ACC GAT GAGCC GGAGGACTT T GCCT CTAAGGT CTT CT T T 1200 

1201 GAC C CAT GT TCT T ACCAGT GC CTGGAGAACTGT GGGGCT GT ACT C CT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 GACCCATGTTCTTATCAGTGCCTGGAGAACTGTGGAGCTGTCCTCCTGACCGTGGTGAGG 1260 

1261 AAAGGGGGAGACAT GT CAAAGACC AT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 1320 

II I I I I I I I I I II II I I I II I I I I I I I I I I I I I I I I I I II I I I II I I I II III 
1261 AAAGGGGGAGAT AT AT C CAAGACCAT GT AC GT GGACTACAAAACAGAGGACGGCT CCGCC 1320 

1321 AATGCAGGGGCT GACTATGAGTTCACAGAGGGCACGGTGGTT CTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 AATGCAGGGGCAGACTATGAGTTCACAGAGGGCACTGTGGTTCTGAAGCCAGGAGAGACC 1380 

1381 CAGAAGGAGTT CT CCGT GGGC ATAATT GAT GACGACAT TTTT GAGGAGGAT GAACACT T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1381 CAGAAGGAGTTCTCTGTGGGCATCATTGATGAT GACAT TTTT GAGGAGGAT GAACACTT C 1440 

1441 TTT GTAAGGTT GAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GCCTCCA 1500 

I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
1441 T TT GT GAGGCT GAGCAAT GT C C GT GT AGAAGAGGAGC AGCT GGCGGAGGGGAT GCT CCC A 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 GCAATACTCAATAGTCTTCCTTTGCCTCGGGCTGTCCTGGCCTCCCCTTGTGTGGCCACA 1560 

1561 GTTACCAT CTT GGATGATGACCATGCAGGCATCTT CACTTTTGAATGTGAT ACT ATTCAT 1620 

II I I II I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I 
1561 GT AAC CAT C T T G GAT GAT GAC CAT G C AG GAAT TTT C ACT TTT GAAT GT GAT AC CAT T CAT 1620 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
1621 GTCAGT GAAAGT AT T GGT GTT AT GGAAGT CAAGGT TT T GAGGACAT C AGGT GCCAGGGGC 1680 



Qy 1681 ACAGT CAT CGT CCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGT GGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1681 ACAGT CAT CGTCCCTTTTAGGACAGTAGAAGGGACAGCCAAGGGT GGTGGCGAGGACTTT 1740 

Qy 1741 GAAGACAC AT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT AT 1786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I 
Db 1741 GAAGATGCATAT GGGGAGCT GGAGTTCAAGAAT GAT GAAACAGTGT 1786 
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AK044636 2534 bp mRNA linear HTC 03-APR-2004 

Mus musculus adult retina cDNA, RIKEN full-length enriched library, 
clone: A930029A02 product : solute carrier family 8 ( sodium/ calcium 
exchanger), member 3, full insert sequence. 
AK044636 

AK044636.1 GI: 26336660 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus . musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 

Carninci,P. and Hayashizaki, Y. 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata,K., Itoh,M., Aizawa,K., Nagaoka,S., Sasaki, N., Carninci,P., 



Konno,H., Akiyama,J., Nishi,K., 
Sumi,N., Ishii,Y., Nakamura,S., 



Kitsunai,T., Tashiro,H., Itoh,M., 
Hazama,M. , Nishine,T., Harada,A. , 
Yamamoto,R. , Matsumoto,H. , Sakaguchi,S. , Ikegami,T. , Kashiwagi,K. , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J. 
Okazaki,Y., Muramatsu,M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 
RIKEN integrated sequence analysis (RISA) system — 384-format 
sequencing pipeline with 384 multicapillary sequencer 
Genome Res. 10 (11), 1757-1771 (2000) 
20530913 
11076861 
4 

The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 



Group Phase I & II Team. 

TITLE Analysis of the mouse transcriptome based on functional annotation 

of 60,770 full-length cDNAs 

JOURNAL Nature 420, 563-573 (2002) 
REFERENCE 6 (bases 1 to 2534) 

AUTHORS Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,*!., Carninci,P., 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A., Hashizume, W. , 
Hayashida, K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M., Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama,T. , Miyazaki,A., Murata,M., 
Nakamura,M., Nishi,K., Nomura, K., Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H., Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki, D., Shibata,K., Shinagawa, A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A., Takahashi, F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A. , Toya,T., Yasunishi, A. , 
Muramatsu,M. and Hayashizaki, Y. 

TITLE Direct Submission 

JOURNAL Submitted ( 16- JUL-2001) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (.GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-res @gsc. riken. jp, 
URL :http: //genome. gsc. riken. jp/, Tel : 81-45-503-9222, 
Fax:81-45-503-9216) 
COMMENT cDNA library was prepared and sequenced in Mouse Genome 

Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Retina RNA was provided by Dr. Stefano Gustincich (Department of 
Neurobiology, Harvard Medical School, 220 Longwood Ave., Boston, MA 
02115, USA) whose assistance is gratefully acknowledged. Please 
visit our web site for further details. 
URL: http: //genome . gsc. riken. jp/ 
URL: http: / /f antom. gsc. riken. jp/ . 
FEATURES Location/Qualifiers 
source 1. .2534 

/organism= fl Mus musculus" 
/mol_type="mRNA" 
/strain="C57BL/6J" 
/ db_x r e f = " FANTOM_DB : A9 3 0 0 2 9 AO 2 " 
/db_xref="taxon: 10090" 
/ cl one= " A9 3 0 0 2 9 AO 2 " 
/ ti s sue_t ype= " ret ina " 
.... . /clone__lib=" RIKEN full-length enriched mouse cDNA library" 

/dev_stage=" adult" 
CDS 713. .>2533 

/note="unnamed protein product; putative 

solute carrier family 8 ( sodium/ calcium exchanger), member 

3 (MGDIMGI: 107976, GB | NM_0 80440, evidence: BLASTN, 99%, 

match=2394)" 

/codon_start=l 

/protein_id="BAC32013.1" 

/db_xref="GI: 26336661" 

/ trans lation="MCPVQGRTMSPVRGHQTARRVS FCQLWYPENPSLGDKIARVIVY 
FVALI YMFLGVS 1 1 ADRFMAS I EVIT SQEREVTI KKPNGETSTTT I RVWNETVSNLTL 



MALGSSAPEILLSLIEVCGHGFIAGDLGPSTIVGSAAFNMFIIIGICVYVIPDGETRK 
I KHLRVFFVTAAWS I FAYI WLYMI LAVFS PGWQVWEGLLTLFFFPVCVLLAWVADKR 
LLFYKYMHKKYRTDKHRGIIIETEGDHPKGIEMDGKMMNSHFLDGNFTPLEGKEVDES 
RREMIRILKDLKQKHPEKDLDQLVEMANYYALSHQQKSRAFYRIQATRMMTGAGNILK 
KHAAEQAKKTSSMSEVHTDEPEDFASKVFFDPCSYQCLENCGAVLLTWRKGGDISKT 
MYVDYKTEDGSANAGADYEFTEGTVVLKPGETQKEFSVGI I DDDI FEEDEHFFVRLSN 
WVEEEQLAEGMLPAILNSLPLPRAVLASPCVATWILDDDHAGIFTFECDTIHVSES 
IGVMEVKVLRTSGARGTVIVPFRTVEGTAKGGGEDFEDAYGELEFKNDETVKTIRVKI 
VDEEEYERQENFFIALGEPKWMERGISGVRFFLNQSNSQER" 

ORIGIN 

Query Match 81.6%; Score 1521; DB 3; Length 2534; 

Best Local Similarity 90.2%; Pred. No. 0; 

Matches 1662; Conservative 0; Mismatches 175; Indels 6; Gaps 3; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGG-CTGGTTAC 59 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 603 ATGGCGTGGTTACGGCTGCACCCTCTCACCTCTGCCTTCCTCCATCTTGGGCCTGGTTAC 662 

Qy 60 CTTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAG 119 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I II 
Db 663 TTTTGTGCTCTTCCTGAATTGTCTTCGAGCAGAGGCTGGTGACTCGGGGGATGTGCCCAG 722 

Qy 120 CACAGGGC AGAACAAT GAGTC CT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT 179 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 723 T GCAGGGCAGAACAAT GAGTC CT GT T C GGGGT CAT CAGACT GCAAGGAGGGT GT CATTT T 782 

Qy 180 GCCAA-TCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCT 238 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 783 GCCAACT CT GGT AT C C AGAGAAC C CTT CC CTT GGGGACAAGAT T GCC AGGGT CAT T GT CT 842 

Qy 239 AT TTTGTGGCCCT GAT AT ACAT GT T C CT T GGGGT GT C CAT CAT T GCT GAC C GCTT CAT GG 298 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I II II I I I I I I I I I I I I I 
Db 843 AT TTTGTGGCCCT GAT AT ACAT GT T T CT T GGGGT GT CT AT C ATT GCT GAC C GAT T CAT GG 902 

Qy 299 CATCTATT GAAGT CATCACCT CT CAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAG 358 

I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 903 CATCTATT GAAGT CATTACTT CCCAAGAGAGGGAAGTGAC CAT CAAGAAGCCCAATGGAG 962 

Qy 359 AAAC C AGC ACAAC CACT AT T C GGGT CT GGAAT GAAACT GT CT C CAAC CT GAC CCT T AT GG 418 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 963 AGAC CAGCACAACT ACAAT T C GGGT AT GGAAT GAAACT GT CTC CAAT CTGAC CCT GAT GG 1022 

Qy 419 CCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGT 478 

I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1023 CCCTGGGCTCTTCTGCTCCAGAGATTCTCCTGTCTTTAATTGAGGTGTGTGGTCACGGGT 1082 

Qy 479 T CATT GCT GGT GAT CT GGGAC CT T CT ACC ATT GT AGGGAGT GCAGCCT T CAACAT GTT CA 538 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I 
Db 1083 T CATT GCT GGT GAT CT GGGAC CAT CT ACC ATC GTT GGCAGT GCAGCCTT CAACAT GTT CA 1142 

Qy 539 T CAT CATT GGC AT CTGTGT CT ACGT GAT CC CAGACGGAGAGACT CGCAAGAT CAAGCAT C 598 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I 
Db 1143 T CAT C ATT GGCAT CT GTGT CT AT GT GAT C C CAGAT GGGGAGACT C GAAAGAT CAAGC AC C 1202 



Qy 599 TACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGA 658 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



1203 TGCGAGTCTTCTTCGTCACGGCTGCTTGGAGCATCTTCGCCTACATTTGGCTCTATATGA 1262 



Qy 659 TTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCT 718 

I ' I I I I I I I I I I I I I I I I I I I I I I I I I ! I II I I I I I I I I I I I I I I I I I II I I I I I I II 
Db 1263 TCCTGGCAGTCTTCTCTCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTTACTCTCTTCT 1322 

Qy 719 TCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAAT 778 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I II I I II I I I I I I I 
Db 1323 TCTTTCCCGTGTGTGTCCTGCTGGCTTGGGTGGCAGATAAGCGACTGCTCTTCTACAAAT 1382 

Qy 779 ACAT GC ACAAAAAGT ACC GC AC AGACAAACACCGAGGAATT ATCAT AGAGACAGAGGGT G 838 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M 
Db 1383 ACAT GC ACAAAAAAT ACC GC AC AGAT AAACACCGAGGAATTATCATT GAGACAGAGGGT G 1442 

Qy 839 AC CACC CTAAGGGCAT TGAGAT GGAT GGGAAAAT GAT GAATT CCCATTTT CTAGAT GGGA 898 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1443 AC CACC CTAAGGGCAT TGAGAT GGAT GGGAAAAT GAT GAATT CT CACTTT CTAGAT GGGA 1502 

Qy 899 AC CT GGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGATGAT C C GGATT C 958 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1503 ACTTTACACCTTT GGAAGGAAAGGAGGTAGATGAATCTCGCAGGGAAATGATCCGGATT C 1562 

Qy 959 TCAAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCA 1018 

I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II 
Db 1563 TAAAG GAT CT GAAACAAAAACACCCAGAAAAGGAC CTAGAT CAGCTGGTGGAGATGGCCA 1622 

Qy 1019 ATTACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTC 1078 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I II I I I I I I I I I I I ■ I 
Db 1623 ATTACTATGCTCTTTCCCATCAACAGAAGAGCCGTGCTTTCTACCGCATCCAAGCCACCC 1682 

Qy 1079 GTAT GATGACTGGTGCAGGCAATATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGG 1138 

I I I I I I I I I I I II II I I I I I I I I II I I I I I I I I I I I I I II I I I II I I I I I I I 
Db 1683 GGATGATGACTGGTGCGGGCAATATACTTAAGAAGCATGCAGCCGAGCAAGCCAAGAAGA 1742 

Qy 1139 CCT C C AGC AT GAGCGAGGT GCACAC C GAT GAGCCT GAGGACT T T ATTT CCAAGGTCT T CT 1198 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I 
Db 1743 CCT C C AGCAT GAGCGAGGT GCAT AC C GAT GAGCC GGAGGACT T T GCCT CT AAGGT CT TCT 1802 

Qy 1199 TT GAC C CAT GTT CTT ACC AGT GCCT GGAGAACT GT GGG GCT GT ACTCCT GACAGT GGT GA 1258 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I 

Db 1803 TTGACCCATGTTCTTATCAGTGCCTGGAGAACTGTGGAGCTGTCCTCCTGACCGTGGTGA 1862 

Qy 1259 GGAAAGGGGGAGACAT GT CAAAGACC AT GTAT GT GGACT ACAAAACAGAGGAT GGTT CT G 1318 

II I I I I II I I I I I II II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I 

Db 1863 GGAAAGGGGGAGAT AT AT C CAAGACC AT GT AC GT GGACT ACAAAACAGAGGAC GGCT CC G 1922 

Qy 1319 C CAAT GC AGGGGCTGACT AT GAGTT C AC AGAGGGCAC GGT GGTT CTGAAGC CAGGAGAGA 1378 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I 
Db 1923 C CAAT GC AGGGGCAGACT AT GAGTT C AC AGAGGGCACT GT GGTT CT GAAGCCAGGAGAGA 1982 

Qy 1379 CCCAGAAGGAGT T CT CC GT GGGCAT AATT GAT GAC GACAT T T TT GAGGAGGAT GAACACT 1438 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1983 CCCAGAAGGAGT T CT CTGTGGGCATCATTGATGATGACATTTTTGAGGAGGAT GAACACT 2042 

Qy 1439 T CTTTGTAAGGTT GAGCAAT GT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTC 1498 

I I I I I II III I I I I I I II II I I I I I I I I I I I I I I I I I I I II I I I I I II I I 
Db 2043 TCTTTGTGAGGCTGAGCAATGTCCGTGTAGAAGAGGAGCAGCTGGCGGAGGGGATGCTCC 2102 



Qy 1499 CAGCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCA 1558 

I I 1 I I I I I I II I I I I I I I I I I I I 1 I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 2103 CAGCAATACTCAATAGTCTTCCTTTGCCTCGGGCTGTCCTGGCCTCCCCTTGTGTGGCCA 2162 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1559 CAGTTACCATCTTGGATGAT GACCAT GCAGGCAT CTTCACTTTTGAATGTGATACTATTC 1618 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I 
2163 CAGTAAC CAT CT TGGAT GAT GACCAT GCAGGAAT TT T CACTT TT GAATGT GAT AC C ATT C 2222 

.1619 AT GT CAGTGAGAGT AT T GGT GT TAT GGAGGT CAAGGTTCT GC GGACAT C AGGT GCCC GGG 1678 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I III 
2223 AT GT CAGT GAAAGT ATT GGT GT TAT GGAAGT CAAGGTTT T GAGGACAT CAGGTGC CAGGG 2282 

1679 GT AC AGT C AT CGT CCCCTTT AGGACAGTAGAAGGGACAGC CAAGGGT GGC GGTGAGGACT 1738 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
2283 GCACAGT CAT CGT C C CT TTT AGGACAGTAGAAGGGACAGC CAAGGGT GGT GGCGAGGACT 2342 

1739 TT GAAGACAC AT AT GGGGAGTT GGAAT TCAAGAAT GAT GAAACT GT ATGT GACAGACAGG 1798 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

2343 TTGAAGATGCATATGGGGAGCT GGAGTTCAAGAAT GATGAAAC AGT GAAAACCAT A 2398 

1799 AAGCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGA 1841 

I I I I I I I I I I I I I I I I I I II I I I I I 

2399 AGGGTTAAAATAGTAGATGAGGAGGAGTACGAGAGGCAAGAGA 2441 
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FEATURES 



Craniata; Vertebrata; Euteleostomi; 
Catarrhini; Hominiciae; Homo. 

and Polayes / D. 



CNSLT1IBJ 1589 bp mRNA linear HTC 18-JUN-2003 

human full-length cDNA 5-PRIME end of clone CS0DB006YD18 of 
Neuroblastoma of Homo sapiens (human) . 
BX248763 

BX248763.1 GI:28375580 ; 
HTC. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 1589) 
Li,W.B., Gruber,C, Jessee,J. 
Full-length cDNA libraries and normalization 
Unpublished 

Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue 

2 (bases 1 to 1589) 
Genoscope . 

Direct Submission 

Submitted ( 13-FEB-2003 ) Genoscope - Centre National de Sequencage : 
BP 191 91006 EVRY cedex - FRANCE (E-mail : seqref@genoscope.cns.fr 
- Web : www.genoscope.cns.fr) 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and Eco RV sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. 

Location/Qualifiers 



source 1. . 1589 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DB006YD18" 
/tissue_type="Neuroblastoma" 

/note="end : 5-PRIME~Cot 10-normalized-vector pCMVSPORT_6" 
CDS 619. .>1589 

/note="unnamed protein product" 
/codon_start=l 
/protein_id="CAD66570. 1" 
./db_xref="GI : 28375581" 

/translation="MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTIKKPNGETSTTTIRVWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
IAGDLGPSTIVGSAAFNMFIIIGICVYVTPDGETRKIKHLRVFFITAAWSIFAYIWLY 
MILAVFSPGWQWEGLLTLFFFPVCVLLAWVADKRLLFYKYMHKKYRTDKHRGIIIE 
TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDL" 

ORIGIN 

Query Match 52.1%; Score 971; DB 3; Length 1589; 

Best Local Similarity 100.0%; Pred. No. 4.8e-267; 

Matches 971; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I.I I I I I 
Db 619 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 678 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 679 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 738 

Qy 121 AC AGGGCAGAACAAT GAGT CCT GT T CAGGGT CATC GGACT GCAAGGAGGGT GT CAT C CT G 180 

- I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I 
Db 739 AC AGGGCAGAACAAT GAGT CCT GT T CAGGGT CAT CGGACT GCAAGGAGGGT GT C ATC CT G 798 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 799 C CAAT CT GGT AC C CGGAGAAC CCTT C CCT T GGGGACAAGATT GC CAGGGT CATT GTCT AT 858 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 859 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 918 

Qy 301 TCT ATTGAAGT CATCACCTCT CAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 360 

I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I IN I I I I I I I I I I I I I I I I I I I I I I I 
Db 919 TCT ATTGAAGT CAT CACCT CTCAAGAGAGGGAGGTGACAATTAAGAAACCCAAT GGAGAA 978 

Qy 361 ACC AGCACAACC ACT AT T C GGGT CT GGAAT GAAACT GT CT CCAAC CT GACCCTT ATGGC C 420 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 979 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 1038 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1039 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1098 



Qy 



481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1099 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 1158 

Qy 541 AT CAT TGGCAT CT GT GT CT ACGT GAT C CC AGACGGAGAGACTCGCAAGAT CAAGCATCT A 600 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I 
Db 1159 ATCATTGGCATCTGTGTCTACGT GAT CCC AGACGGAGAGACTCGCAAGAT CAAGCATCT A 1218 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1219 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1278 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1279 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1338 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1339 TT T CCAGT GT GT GT C CTT CT GGCCT GGGT GGC AGATAAAC GACT GCT CT T CT ACAAAT AC 1398 

Qy 781 AT GCACAAAAAGT AC C GCACAGACAAAC ACCGAGGAATT AT CAT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1399 AT GCACAAAAAGT AC C GCACAGACAAACACCGAGGAATT AT CAT AGAGACAGAGGGT GAC 1458 

Qy 841 C ACCCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT CCC ATTTT CTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1459 CACCCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT CCC ATTTT CT AGATGGGAAC 1518 

Qy 901 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGTC CCGC AGAGAGAT GAT C CGGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1519 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGTC CCGCAGAGAGAT GAT C CGGATT CT C 1578 

Qy 961 AAGGAT CT GAA 971 

I I I I I I I I I I I 
Db 1579 AAGGATCTGAA 1589 
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BX374548 938 bp mRNA linear EST 23-APR-2004 

BX374548 Homo sapiens NEUROBLASTOMA COT 1 0-NORMALI Z ED Homo sapiens 
cDNA clone CS0DB006YD18 5-PRIME, mRNA sequence. 
BX374548 

BX374548.2 GI:46558208 
EST. 

Homo sapiens (human) 
Homo sapiens 
Eukaryota; Metazoa; 
Mammalia; Eutheria; 
1 (bases 1 to 938) 

Li,W.B., Gruber,C, Jessee, J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 8, 2003 this sequence version replaced gi: 30438490. 
Contact : Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref @genoscope . ens . f r, Web : www.genoscope.cns.fr 



Chordata; Craniata; Vertebrata; Euteleostomi ; 
Primates; Catarrhini; Hominidae; Homo. 



FEATURES 

source 



1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
7256. r 

For more information about this cluster, see 

http: //www.genoscope. ens. f r/cdna?s=CS0DB006DB09_DB1287_2&c=7256 . r. 
Location/Qualifiers 
1. .938 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DB006YD18" 

/tissue_type="NEUROBLASTOMA COT 10-NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 10-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 48.3%; 
Best Local Similarity 97.8%; 
Matches 918; Conservative 



Score 899.2; DB 5; 
Pred. No. 1.7e-246; 
0; Mismatches 20; 



Length 938; 
Indels 1; 



Gaps 



1; 



Qy 

Db 



687 CCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTG 746 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1 CCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCC-GTGTGTGTCCTTCTGGCCTG 59 



Qy 

Db 



747 GGTGGCAGATAAACGACT GCT CTTCTACAAATACATGCACAAAAAGTACCGCACAGACAA 806 

I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
60 GGTGGCAGATAAACGACT GCT CTTCTACAAATACATGCACAAAAAGTACCGCACAGACAA 119 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



807 



120 



867 



180 



927 



240 



987 



300 



ACACC GAGGAAT TAT CAT AGAGACAGAGGGT GACCACCCTAAGGGC ATTGAGAT GGAT GG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACACCGAGGAAT TAT CAT AGAGACAGAGGGT GAC CACCCTAAGGGC ATTGAGAT GGAT GG 

GAAAAT GAT GAATT CC C ATTT T CT AGATGGGAAC CTGGT GCCC CT GGAAGGGAAGGAAGT 

I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAAAATGATGAATTCCCATTTTCTAGATGGGAACCTGGTGCCCCTGGAAGGGAAGGAAGT 



866 



179 



926 



239 



986 



GGAT GAGT CCC GCAGAGAGAT GAT C C GGAT T CTC AAGGAT CT GAAGCAAAAACACCCAGA 

I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGAT GAGT CC C GCAGAGAGAT GAT C CGGATT CT CAAGGAT CT GAAGCAAAAACAC CCAGA 299 

GAAGGACTT AGAT CAGCT GGT GGAGAT GGCCAATT ACT AT GCT CTT T C CCAC CAACAGAA 1046 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
GAAGGACTT AGAT CAGCTGGT GGAGAT GGCCAATT ACT AT GCTCTTTCCCACCAACAGAA 359 



1047 . GAGC CGCGC CT T CT ACC GT AT C CAAGC CACT C GT ATGAT GACT GGT GC AGGCAAT ATC CT 1106 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
. 360 GAGCCGCGCCTTCTACCGTATCCAAGCCACTCGTATGATGACTGGTGCAGGCAATATCCT 419 



Qy 1107 GAAGAAACAT GC AGCAGAACAAGCCAAGAAGGC CT CC AGCAT GAGC GAGGT GCAC ACCGA 1166 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGC CT CC AGCAT GAGC GAGGT GCACACCGA 479 



Qy 

Db 



1167 



480 



TGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAGTGCCTGGA 1226 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAGTGCCTGGA 539 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 



1227 GAACTGTGGGGCTGTACTCCT GACAGTGGT GAGGAAAGGGGGAGACATGT CAAAGACCAT 1286 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I 
540 GAACT GTGGGGCTGTACTCCT GACAGT GGT GAGGAAAGGGGGAGACAT GT CAAAGACCAT 599 



1287 GTATGTGGACTACAAAACAGAGGAT GGTTCT GCCAATGCAGGGGCTGACTAT GAGTTCAC 1346 

I I I I I I II I II I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I 
GT ATGT GGACT ACAAAAC AGAGGAT GGTTCT GC CAAT GCAGGGGCT GACTAT GAGT T CAC 659 



600 



1347 AGAGGGCACGGT GGTTCT GAAGCCAGGAGAGACCCAGAAGGAGTTCTCCGTGGGCATAAT 1406 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I 
AGAGGGC AC GGT GGTT CT GAAGCCAGGAGAGAC C CAGAAGGAGTT CT CCGT GGGCATAAT 



660 



719 



1407 T GAT GACGACAT TTTT GAGGAGGAT GAACACTT C TT T GT AAGGTT GAGCAAT GT CCGC AT 1466 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
T GAT GACGACAT TTTT GAGGAGGAT GAACACTT CTT T GNTAGGTT GAGCAAT GT CCGCAT 



720 



1467 AGAGGAGGAGCAGC CAGAGGAGGG GAT GCCT CCAGCAAT ATT CAACAGT CTTCCCTTGCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGAGGAGGAGCAGCCAGAGGAGGGGATGCCTNNCAGCATATTCAAACAGTCTT CCTT GCC 



780 



1527 



840 



TCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGATGACCATGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCGGGCTGTCCTAGCCTNCCCTTGNGTGGNCACAGTTACCATCTTGGATGATGACCATGC 



1625 



779 



1526 



839 



1586 



899 



1587 AGGCAT CT T CACT TTT GAAT GT GAT ACT ATT CAT GT CAG 
I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
900 NAGCAT CT T CACT TTT GAAT GT GAT ACT ATT CAT GT CAG 938 



RESULT 8 
BI913344 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
. SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BI913344 887 bp mRNA linear EST 16-OCT-2001 

603178823F1 NIH_MGC_121 Homo sapiens cDNA clone IMAGE : 5243308 5', 
mRNA sequence. 
BI913344 

BI913344.1 GI:16177710 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 887) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 

Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Life Technologies, Inc. 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 



FEATURES 

source 



ORIGIN 



found through the I.M.A.G.E. Consortium/LLNL at: 

http : //image . llnl . gov 

Plate: LLAM11613 row: m column: 05 

High quality sequence stop: 782. 

Location/Qualifiers 

1. .887 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/ cl one= " IMAGE : 5 2 4 3 3 0 8 " 
/lab_host="DH10B" 
/clone_lib="NIH_MGC_121" 

/note="0rgan: brain; Vector: pCMV-SPORT6; Site_l: NotI; 
Site_2: EcoRV (destroyed); RNA source anonymous pool of 3 
fetal brains, female age 20 weeks, female age 24 weeks, 
and male age 26 weeks. Library is oligo-dT primed and 
directionally cloned (EcoRV site is destroyed upon 
cloning) . Average insert size 1.7 kb, insert size range 
0.7-3.5 kb. Library is normalized and enriched for 
full-length clones and was constructed by C. Gruber 
(Invitrogen) . Research Genetics tracking code 017. Note: 
this is a NIH_MGC Library." 



Query Match 43.2%; 
Best Local Similarity 98.0%; 
Matches 836; Conservative 



Score 805; DB 4; Length 887; 
Pred. No. 2e-219; 
0; Mismatches 15; Indels 



2 ; Gaps 



2; 



Qy 

Db 



916 GGGAAGGAAGTGGAT GAGT CCCGCAGAGAGATGAT CCGGATTCT CAAGGAT CTGAAGCAA 975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
1 GGGAAGGAAGT GGAT GAGT CC C GCAGAGAGAT GAT CCGGAT TCT CAAGGAT CT GAAGCAA 60 



Qy 

Db 

Qy 

Db 

Qy 

Db 



976 AAACACCC AGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC CAATT ACT AT GCT CTTT CC 1035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I 
61 AAACACCCAGAGAAGGACTTAGAT CAGCT GGT GGAGAT GGC CAATT ACT AT GCT CTTT CC 120 

1036 CACCAACAGAAGAGCC GCGCCTT CT AC CGT AT CCAAGC C ACTC GTAT GAT GACT GGT GCA 1095 
I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 CACCAACAGAAGAGCC GC GCCTTCT AC CGT AT CCAAGC C ACT C GTAT GAT GACT GGT GCA 180 

1096 GGCAAT AT CCT GAAGAAACAT GCAGC AGAACAAGC CAAGAAGGCCT C C AGCAT GAGC GAG 1155 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 GGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGC CT CCAGCAT GAGC GAG 240 



Qy 

Db 

Qy 

Db 

Qy 

Db 



1156 GT GCACAC CGATGAGCCT GAGGACTTT ATTTC CAAGGT CTT CTT T GAC C CAT GTT CTT AC 1215 
I I I I I I II I I I I I I I I I I I I I I U I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 GT GCAC ACCGAT GAGC CT GAGGACT T T ATTTC CAAGGT CTT CTTT GAC C CAT GT T CT T AC 300 

1216 CAGT GCCTGGAGAACT GTGGGGCT GTACTCCTGACAGT GGT GAGGAAAGGGGGAGACATG 1275 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 CAGT GCCT GGAGAACT GT GGGGCT GT ACT C CT GACAGT GGT GAGGAAAGGGGGAGACAT G 360 

1276 TCAAAGACCAT GT ATGTGGACTACAAAACAGAGGATGGTTCTGCCAAT GCAGGGGCTGAC 1335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 TCAAAGACCAT GTAT GTGGACT ACAAAAC AGAGGAT GGTT CTGC CAATGC AGGGGCT GAC 420 



Qy 



1336 TAT GAGTT CACAGAGGGCACGGT GGTT CT GAAGCC AGGAGAGAC C CAGAAGGAGT T CT CC 



1395 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
421 TAT GAGT T C ACAGAGGG CACGGT GGTT CT GAAGC CAGGAGAGAC CCAGAAGGAGTT CTC C 480 



1396 GT GGGCAT AATT GAT GACGAC ATT TT T GAGGAGGAT GAAC ACTT CTTT GT AAGGTT GAGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

481 GT GGGCAT AATT GAT GACGAC ATT T T T GAGGAGGAT GAACACTT CTTT GT AAGGTT GAGC 

1456 AAT GTCC GCAT AGAGGAGGAGC AGC CAGAGGAGGGGAT GC CT C CAGCAAT ATT CAAC AGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAT GT C C GCAT AGAGGAGGAGCAGC CAGAGGAGGGGAT GCCT CCAGC AAT ATT CAAC AGT 



541 



1516 



601 



CTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGAT 



1576 GATGACCAT GCAGGCATCTT CACTTTT GAATGTGATACTATTCAT GTCAGTGAGAGTATT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAT GACCAT GCAGGCATCTT CACTTTT GAAT GT GAT ACT ATT CAT GT CAGTGAGAGTA-T 



661 



1636 



720 



GGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCC 
I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
GGTGTAATGGAGGTCAAGGTTCTGCGGACATCATGTGCCCGGGGTACAGTCATCGTCCCC 



1455 



540 



1515 



600 



1575 



660 



1635 



719 



1695 



779 



1696 TT T - AGGAC AGT AGAAGGGAC AGCCAAGGGT GGC GGT GAGGACTTTGAAGACACAT AT GG 1754 
III II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I 
7 80 TT T CAGGAC AGGAGAAGGGAC AGCCAAGGCT GCACGCTAAGGACTTGAAGACC CAT AT GC 839 

1755 GGAGTTGGAATTC 1767 

I I I I I I I I I I I I I 
840 GGAGTTGGAATTC 852 



RESULT 9 
AY398961 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



GI: 39754950 



(human) 



Craniata; Vertebrata; Euteleostomi; 
Catarrhini; Hominidae; Homo. 



AY398961 2922 bp DNA linear GSS 15-DEC-2003 

Homo sapiens SLC8A1 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY398961 
AY398961. 
GSS. 

Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chorda ta; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 2922) 

Clark,A.G., Glanowski , S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp -mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2922) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 



Adams , M . D . and Cargill,M. 
TITLE Direct Submission 

JOURNAL Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 
COMMENT This sequence was made by sequencing genomic exons and ordering 

them based on alignment. 
FEATURES Location/Qualifiers 
source 1. .2922 

/organism="Homo sapiens" 
/ mo l_type=" genomic DNA" 
/db_xref="taxon: 9606" 
gene <1. .>2922 

/gene="SLC8Al" 
/locus_tag="HCM0065" 

ORIGIN 

Query Match 42.1%; Score 784.8; DB 9; Length 2922; 

Best Local Similarity 68.3%; Pred. No. 2.1e-213; 

Matches 1165; Conservative 0; Mismatches 502; Indels 39; Gaps 4; 

Qy 109 GACGT GCCAAGC AC AGGGC AGAACAAT GAGT C CT GTT CAGGGT C AT CGGACT GCAAGGAG 168 

II II II III I I I I I I I I I I I I I I I I I I I I I I I 

Db 112 GAAAT GGAAGGAGAAGGAAAT GAAACT GGT GAAT GT ACT GGAT CAT AT T ACT GTAAGAAA 171 

Qy 169 GGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGG 228 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 172 GGGGTGATTTTGCCCATTTGGGAACCCCAAGACCCTTCTTTTGGGGACAAAATTGCTAGA 231 

Qy 229 GTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGAC 288 

I I I II I I I I I I I I I I I I II I I I I II I I I I I I II II II I I I I I I I II I 
Db 232 GCT ACT GT GT AT TT T GT GGCC AT GGT CT AC AT GTT TCTT GGAGTCT CT AT C AT AGCTGAT 291 

Qy 289 C GCTT C AT GGCAT CT ATT GAAGT CAT C ACCT CT CAAGAGAGGGAG GT GACAATTAAGAAA 348 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 292 C GGT T CAT GT CCT CTAT AGAAGT CAT CACAT CT CAAGAAAAAGAAAT AACC ATAAAGAAA 351 

Qy 349 C CCAAT GGAGAAAC CAGCACAAC CACT ATT CGGGT CT GGAAT GAAACT GT CT CCAACCT G 408 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 352 CCCAATGGAGAGACCACCAAGACAACTGTGAGGATCT GGAAT GAAACAGTTT CTAACCTG 411 

Qy 409 ACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGT 468 

III I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 412 ACCTTGATGGCCCTGGGATCTTCT GCT CCTGAGATTCTCCTTTCAGTAATT GAAGT GTGT 471 

Qy 469 GGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTC 528 

.11 III I I I I III II II II II III I I I I I II II I I I I I Mill 
Db 472 GGCCATAACTTCACTGCAGGAGACCTCGGTCCTAGCACCATCGTGGG7\AGTGCTGCATTC 531 

Qy 529 AAC AT GTT CAT CAT CAT T GGCAT CT GT GT CTACGT GAT C C CAGAC GGAGAGACT C GCAAG 588 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 532 AATAT GTT CATCATTATT GCACTCTGTGTTTATGTGGTGCCT GACGGAGAGACAAGGAAG 591 

Qy 589 AT CAAGCAT CT ACGAGT CTT CTTCAT C ACC GCT GCTT GGAGT AT CTT T GC CT ACAT CT GG 648 

II I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I II I I I II I I I I 

Db 592 ATTAAGCATTTGCGTGTCTTCTTTGTGACAGCAGCCTGGAGCATCTTTGCCTACACCTGG 651 



Qy 



649 



CTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTC 708 



I I 1 1 1 1 1 1 1 1 1 I 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 

. Db 652 CTTTACATTATTTTGTCTGTCATATCTCCTGGTGTTGTGGAGGTCTGGGAAGGTTTGCTT 711 

Qy 709 ACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTC 768 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 712 ACTTTCTTCTTCTTTCCCATCTGTGTTGTGTTCGCTTGGGTAGCGGATAGGAGACTTCTG 771 

Qy 769 TTCTACAAATACATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAG 828 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 772 TTT T AC AAGT AT GT CT ACAAGAGGT AT C GAGCT GGC AAGC AGAGGGGGAT GAT TAT T GAA 831 

Qy 829 ACAGAGGGT GAC CAC C C TAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAAT 879 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 832 CAT GAAGGAGACAGGC CAT CTT CTAAGACT GAAATT GAAATGGACGGGAAAGT GGT CAAT 891 

Qy 880 TCCCATTTTCTAGATGGGAACCTGGTGCCCCTGGAAGGGAAG 921 

I I I I I I I I I I I I I I I I III 

Db 892 T CT C AT GTT GAAAAT T T CTT AGAT GGT GCT CT GGTT CTGGAGGT GGATGAGAGGGACCAA 951 

Qy 922 GAAGTGGATGAGTCCCGCAGAGAGAT GATCCGGATT CTCAAGGATCTGAAGCAAAAACAC 981 

III I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 952 GATGATGAAGAAGCTAGGCGAGAAATGGCTAGGATTCTGAAGGAACTTAAGCAGAAGCAT 1011 

Qy 982 CCAGAGAAGGACTT AGATCAGCT GGT GGAGAT GGC CAAT T ACTAT GCTCTTT CC CAC CAA 1041 

I I I I I I I I I I I I I I I I III I I I I I I I I I I II I I I I 

Db 1012 CCAGATAAAGAAAT AGAGCAATT AATAGAAT T AGCTAACT ACCAAGT CCTAAGT C AGCAG 1071 

Qy 1042 CAGAAGAGCC GCGC CT T CT AC C GT AT C CAAGC CACT C GT AT GAT GACTGGT GCAGGCAAT 1101 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1072 CAAAAAAGT AGAGC ATTTT AT C GC AT T CAAGCTACT C GC CT CAT GACTGGAGCT GGCAAC 1131 

Qy 1102 ATCCT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGCCT CCAGCAT GAGCGAGGTGCAC 1161 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1132 ATTTTAAAGAGGCATGCAGCT GACCAAGCAAGGAAGGCTGTCAGCAT GCACGAGGTCAAC 1191 

Qy 1162 ACCGAT GAGCCT G AGGACT TT ATTTC CAAGGT CT T CT TT GAC C CAT GTT CT T ACCAG 1218 

I I II I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I 
Db 1192 ACTGAAGT GACT GAAAAT GAC C CT GTT AGTAAGAT CT T CT TT GAACAAGGGACAT AT CAG 1251 

Qy 1219 T GCCT GGAGAACT GT GGGGCT GTACT C CT GAC AGT GGT GAGGAAAGGGGGAGACAT GT C A 1278 

I I I I I I I I I I I I I I I I MM II I I I I I I I I M M I I III. 
Db 1252 T GTCT GGAGAACT GT GGT ACT GTGGC CCTT ACCAT TAT C C GCAGAGGT GGT GATT T GACT 1311 

Qy 1279 AAGACCATGT AT GT GGACT ACAAAACAGAGGAT GGTT CT GC CAAT GC AGGGGCT GACTAT 1338 

I I I I II I II I I I M I I I I I I I I I I II M I I I I II I I II I I I I I I I I 

Db 1312 AACACT GTGT T T GT T GACTT CAGAACAGAGGAT GGCACAGCAAAT GGTGGGT CT GATT AT 1371 

Qy 1339 GAGT T CACAGAGGGC ACGGT GGTT CT GAAGC CAGGAGAGACC CAGAAGGAGTTCT CC GT G 1398 

II I I I I M M II I II I I I I I I II II II I I II II I I I II II III 

Db 1372 GAATT TACT GAAGGAACT GT GGT GTTT AAGC CTGGT GAT ACC CAGAAGGAAATCAGAGT G 1431 

Qy 1399 GGCATAATT GAT GACGACATTTTT GAGGAGGAT GAACACTT CTTT GTAAGGT T GAGCAAT 1458 

II II M I I I II II M I I I I I II I I I II II I I II I MM I I II I I I 

Db 1432 GGT AT CAT AGAT GAT GAT AT CTTT GAGGAGGAT GAAAAT TT CCTT GT GC AT CT C AGCAAT 1491 

Qy 1459 GT CC GCAT AGAGGAGGAGCAGC CAGAGGAGGGGAT G C CT CC AGCAAT ATT CAACAGT CT T 1518 

Ml II II II II I I I I I I I III I I I I I 



Db 



1492 GT CAAAGT AT CT T CT GAAGCT T C AGAAGAT GGCATACTGGAAGC 



CAATCAT 1542 



Qy 1519 CCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGAT 1578 

I II III II I I Mill' I I I I I I I I I I I I I I I I I II 
Db 1543 GTTTCTACACTTGCTTGCCTCGGATCTCCCTCCACTGCCACTGTAACTATTTTTGATGAT 1602 

Qy 1579 GAC CAT GCAGGCAT CTT CACTT T T GAAT GT GAT ACT ATT CAT GT CAGT GAGAGT AT T GGT 1638 

I I I I I I I I I II I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1603 GAC C AC GCAGGCAT TTTTACTT TT GAGGAAC CT GTGACT CAT GT GAGT GAGAGCAT TGGC 1662 

Qy 1639 GTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCCTTT 1698 

I I I I I I I I I I I I I II I I I I II It'll II II I I I I I I I I I I I I 
Db 1663 AT CAT GGAGGT GAAAGT ATT GAGAACAT CT GGAGCT C GAGGAAAT GTT AT CGTT CCAT AT 1722 

Qy 1699 AGGAC AGT AGAAGGGAC AGCCAAGGGT GGC GGT GAGGACTTT GAAGACACAT ATGGGGAG 1758 

I II I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1723 AAAAC CAT C GAAGGGACT GCC AGAGGT GGAGGGGAGGATTTT GAGGACACTT GT GGAGAG 1782 

Qy 1759 TTGGAATT CAAGAAT GATGAAACT GT 1784 . 

I I I I I I I I I I I I I I I I I I I III 
Db 1783 CT CGAATT CCAGAAT GATGAAATT GT 1808 
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BX347210 939 bp mRNA linear EST 23-APR-2004 

BX347210 Homo sapiens NEUROBLASTOMA COT 10-NORMALIZED Homo sapiens 
cDNA clone CS0DB006YD18 5-PRIME, mRNA sequence. 
BX347210 

BX347210.1 GI:30381158 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 939) 
Li,W.B., Gruber,C 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 

and Polayes, D. - 



FEATURES 

source 



Jessee, J. 

Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref ©genoscope . ens . f r, Web : www.genoscope.cns.fr 
1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the .pCMVS PORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
7256. r 

For more information about this cluster, see 

http : //www. genoscope . ens . f r/cdna?s=CS0BAA004ZB09_CS00355_l&c=7256. r 

Location/Qualifiers 
1. .939 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db xref="taxon:9606" 



/clone="CS0DB006YD18" 

/tissue_type=" NEUROBLASTOMA COT 10-NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 10-NORMALIZED" 
/note= l! lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 

ORIGIN 

Query Match 41.2%; Score 768.2; DB 5; Length 939; 

Best Local Similarity 95.6%; Pred. No. 7.7e-209; 

Matches 854; Conservative 0; Mismatches 33; Indels 6; Gaps 6; 

Qy 105 AGGGGACGT GCCAAGCAC AGGGCAGAACAAT GAGT CCT GTT C AGGGT C AT CGGACT GCAA 164 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I M I I I I I I I I I I I I I I I I I I 
Db 22 AGGGGACGT GCC-AGCAC AGGGCAGAACAAT GAGT CCT GTT- AGGGT CAT CGGACT GCAA 79 

Qy 165 GGAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGC 224 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 80 GGAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGC 139 

Qy 225 CAGGGT C ATTGT CT AT TTT GT GGCC CT GAT AT AC ATGT T C CTT GGGGT GT C CAT CATT GC 284 

1 1 1 1 1 1 ii i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 140 CAGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGC 199 

Qy 285 T GACCGCTTCAT GGCATCTATTGAAGT CATCACCTCTCAAGAGAGGGAGGTGACAATTAA 344 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 200 T GAC C GCTT CAT GGCAT CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAA 259 

Qy 345 GAAAC CCAAT GGAGAAACC AGCACAAC CACT ATT C GGGT CT GGAAT GAAACT GT CT CCAA 404 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 260 GAAAC C CAAT GGAGAAAC C AGCACAAC CACTATT CGGGT CT GGAAT GAAACT GT CT CCAA 319 

Qy 405 CCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGT 464 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 320 CCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGT 379 

Qy 4 65 GTGT GGTC AT GGGT TC ATT GCT GGT GATCT GGGAC CTT CT ACC ATT GT AGGGAGT GCAGC 524 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 380 GTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGC 439 

Qy 525 CTT CAACAT GT T CAT CAT CATT GGCAT CT GT GT CT ACGTGAT C CCAGACGGAGAGACT CG 584 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 440 CTT CAACAT GT T CAT CAT CAT T GGCAT CT GT GT CT AC GT GAT C C CAGACGGAGAGACT C G 499 

Qy .585 CAAGAT CAAGC AT CTACGAGT CTT CT T CAT CAC CGCT GCTT GGAGT AT CT TT GCCT ACAT 644 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I 
Db 500 CAAGAT CAAGCAT CT AC GAGT CT T CTT CAT CACCGCT GCTT GGAGT AT CT TT GCCTAC AT 559 

Qy 645 CTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCT 704 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 560 CTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGG-AGGCCT 618 

Qy 705 CCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACT 764 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 619 C CT CACT CT CT TCTTC-TTCCAGTGT GTGT CCT TCTGGCCT GGGT GGCAGATAAACGACT 677 



Qy 765 GCT CT T CT ACAAATACAT GCACAAAAAGTACC GCACAGACAAACACC GAGGAATTAT CAT 824 

I I I I I I I I I I I I I I I II I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I III II 
Db 678 GCT CTT CT ACAAATACAT GCACAAAAAGTACC GCACAGACAAACACCGAGGGAT TT AT AT 737 

Qy 825 AGAGAC AGAGGGT GACCACCCTAAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAATT CC C A 884 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 738 AGAGAC AGAGGGT GACCACCCTAGGGGCTTTGGGATGGGTGGGAAAAGGAT GAATT C CCA 797 

Qy 885 TTTT CT AGAT GGGAACCT GGT GCCCCT GGAAGGGAAGGAAGT GGAT GAGT - CCC GCAGAG 943 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 798 TTTT CT AGGAGGGAAACCT GT GCCCCCT GAAGGGAAGAAAGT GGATTAAT C CCC GCAGAG 857 

Qy 944 AGAT GAT CC GGATTCT C- AAGGAT CT GAAGCAAAAACAC CCAGAGAAGGACTT 995 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I III I II I I I 
Db 858 AGAT GAACC C GGTT CT CT AGGGAT CT GAAACCAAAAAC C CCC CAAAAAGGCCT 910 
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FEATURES 

source 



gene 



Craniata; Vertebrata; Euteleostomi; 
Sciurognathi; Muridae; Murinae; Mus . 



AY398963 2922 bp DNA linear GSS 15-DEC-2003 

Mus musculus SLC8A1 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY398963 

AY398963.1 GI: 39754952 
GSS. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Rodentia; 

1 (bases 1 to 2922) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu, F. , Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp -mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 
Clark, A. G. , 
Todd, M. A. , 
Fe'rriera, S 



to 2922) 

Glanowski, S . , Nielson,R., Thomas, P., Kejariwal,A. 
Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
, Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 



ORIGIN 



Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .2922 

/organism="Mus musculus" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 10090" 
<1. .>2922 
/gene="SLC8Al" 
/locus_tag="HCM0065" 



Query Match 40.5%; Score 755; DB 9; Length 2922; 

Best Local Similarity 67.8%; Pred. No. 7.8e-205; 

Matches 1134; Conservative 0; Mismatches 500; Indels 39; Gaps 4; 

Qy 142 TGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAAC 201 

I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I II 

Db 145 T GT ACT GGCT C AT AT T ACT GTAAGAAAGGGGT GAT CTT G CC CATT TGGGAACCCCAAGAC 204 

Qy 202 CCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATATACATG 261 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 205 CCATCTTTTGGGGACAAAATTGCTAGAGCAACTGTGTATTTTGTGGCCATGGTCTACATG 264 

Qy 262 TTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCATCTATTGAAGTCATCACCTCT 321 

I I I I I I I I II II II I I I I I I I I I I II III I I I I I I II I I I I I I I I I I I I 
Db 265 TTCCTT GGAGTT T CT ATT ATT GCAGACC GGT T TAT GT C CT CT AT AGAGGT CAT C AC CT CT 324 

Qy 322 CAAGAGAGGGAGGTGACAATT AAGAAAC C CAAT GGAGAAACC AGC ACAAC CACT AT T CGG 381 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 325 CAAGAGAAAGAAAT AACGATAAAGAAAC CGAAT GGAGAGACC AC CAAGAC GACGGT GAGA 384 

Qy 382 GTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAG 441 

I I I I I I I II I I I I I II I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 385 ATCTGGAACGAGACTGTGTCGAACCTGACCTTGATGGCCCTGGGATCTTCTGCTCCTGAG 444 

Qy 442 ATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCT 501 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 445 ATTCTCCTGTCAGTCATTGAAGTGTGCGGCCATAACTTCACCGCAGGGGACCTGGGTCCC 504 

Qy 502 T CT ACC ATT GT AGGGAGT GCAGCCTT CAACAT GTT CAT CAT CATT GGCATCTGT GT CT AC 561 

I I I I I II II I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I III 
Db 505 AGCAC C AT CGT GGGAAGT GCT GCCTTTAACAT GTT CAT CATAAT C GC ACT CTGT GTT T AC 564 

Qy 562 GT GAT C CCAGAC GGAGAGACT CGCAAGAT CAAGCAT CT ACGAGT CTT CTT CAT C AC C GCT 621 

III I I I I II I I I I I I I I I I I I I I I II I I I I I I II II I I I I I I II II 
Db 565 GT GGT C C CT GAT GGAGAGACAAGGAAGAT CAAGCAT CT GCGT GT GTT CTT T GT GAC AGC A 624 

Qy 622 GCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGT 681 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 625 GCCTGGAGCATCTTTGCCTATACCTGGCTTTATATAATCTTGTCTGTCAGCTCTCCTGGA 684 

Qy 682 GTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTG 741 

II I I I I I I I I I I I I I I I I I I I II II I I I I I I II I I I I I I I I I I 

Db 685 GTTGTGGAGGTCTGGGAAGGCTTGCTTACTTTCTTCTTCTTTCCCATCTGCGTTGTGTTC 744 

Qy 742 GCCT GGGTGGCAGATAAAC GACT GCT CTT CT ACAAAT AC AT GCACAAAAAGTAC CGCACA 801 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 745 GCGTGGGTAGCAGACAGGCGGCTTCTCTTTTACAAGTATGTCTACAAGCGGTACAGGGCC 804 

Qy 802 GACAAACAC C GAGGAATT AT C AT AGAGACAGAGGGT GACCAC CC TAAGGGC 852 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 805 GGCAAGCAGAGGGGGATGAT CATT GAACATGAAGGAGACAGACCAGCTTCCAAAACTGAA 864 

Qy 853 ATT GAGAT GGAT GGGAAAAT GAT GAATT C C C ATT TT CT AGAT GGGAAC CT GGT GCC C CT G 912 

I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I 

Db 865 AT C GAAAT GGAT GGGAAAGT GGT CAACT CT CAT GTT GACAATTT CTTAGAT GGGGCT CT G 924 



Qy 913 G AAGGGAAGGAAGT GGAT GAGT CC CGC AGAGAGAT GAT CC GG 954 

I I I II I II II III I MINI II 

Db 925 GTTTT GGAAGTT GAT GAGAGGGACCAAGAT GAT GAGGAAGCCAGGC GT GAGAT GGCAAGG 984 

Qy 955 ATT CT CAAGGAT CT GAAGCAAAAACACCCAGAGAAGGACT T AGAT CAGCT GGT GGAGAT G 1014 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I III I 
Db 985 ATTCTGAAGGAACTTAAGCAGAAGCATCCTGAGAAAGAAATTGAGCAATTAATAGAATTA 1044 

Qy 1015 GCCAATTACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCC 1074 

I I I I I I II I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1045 GCCAACTACCAGGTCCTAAGTCAACAGCAGAAAAGCCGAGCATTTTACAGGATTCAAGCT 1104 

Qy 1075 ACT CGT AT GAT GACT GGT GC AGGCAAT AT CCT GAAGAAACAT GC AGCAGAACAAGC CAAG 1134 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I 
Db 1105 ACTCGCCT GATGACCGGAGCT GGCAACAT CTTGAAGAGGCACGCAGCTGAT CAAGCAAGG 1164 

Qy 1135 AAGGC CT C C AGC AT GAGC GAGGT GCACAC CGAT GAGC CT G AGGACTTTATTTCCAAG 1191 

I I I I I I I I I I I I I I I III II I I I I I I I I I III 

Db 1165 AAGGCT GT CAGTATGCATGAAGTCAACAT GGAAAT GGCT GAAAACGACCCAGTCAGTAAG 1224 

Qy 1192 GTCTTCTTTGACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACA 1251 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 
Db 1225 ATCT T CTTT GAGCAAGGAAC AT ACCAGT GT CT AGAGAACT GT GGT ACT GT GGC C CT CAC C 1284 

Qy 1252 GTGGT GAGGAAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT 1311 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II 
Db 1285 ATT ATGCGCAGAGGGGGCGACTTGAGCACCACT GTGTTTGTT GACTTCAGGACAGAAGAC 1344 

Qy 1312 GGT T CT GCCAAT GCAGGGGCT GACT AT GAGTT C ACAGAGGGC ACGGT GGTT CT GAAGC C A 1371 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1345 GGCACAGCCAAT GCTGGGT CT GAT TAT GAATT C ACGGAAGGGACT GT GAT CTT CAAAC CA 1404 

Qy 1372 GGAGAGAC C CAGAAGGAGTT CT C C GT GGGCATAATT GAT GAC GACATTTTT GAGGAGGAT 1431 

I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1405 GGGGAGAC C CAGAAGGAAATCAGAGT T GGCAT CAT TGAT GAT GAT AT CTTT GAAGAAGAT 1464 

Qy 1432 GAACACTT CTTT GTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGG 1491 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I' 

Db 1465 GAAAACTT C CTT GT GCAT CT TAGCAAT GT CAGAGT CT CT T CAGAT GT TTCAGAAGATGGC 1524 

Qy 14 92 ATGCCTCCAGCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGT 1551 

II III I I I I II I III I I I I I I I I 

Db 1525 AT ACT AGAAT CCAAT CAC GCT T CTT CAAT T GCT T GT CTT GGGT CAC C CAGC 1575 

Qy 1552 GT GGC C ACAGTT AC CAT CTT GGAT GAT GAC CAT GCAGGCAT CTTCACT TTT GAAT GT GAT 1611 

I I I I I I I I I I I I I I I UN I I I I I I I I I I I I I I I I I II I II I I 
Db 1576 ACT GCCAC CATAAC CAT TTTT GAT GAT GACCAT GCAGGCATCTTT ACATTT GAGGAACCC 1635 

Qy 1612 ACTATTCAT GT CAGTGAGAGTATTGGT GTTATGGAGGTCAAGGTT CT GCGGACATCAGGT 1671 

I III II II Mill I I I I I I I I I I I I I I I I I I II II I II II II 
Db 1636 GT GACT CAC GT GAGCGAGAGCATT GGCAT CAT GGAGGT GAAGGTT TT GAGAACCT CTGGA 1695 

Qy 1672 GCCCGGGGTACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGT 1731 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1696 GCT C GAGGAAAT GTTAT C ATT C C CT ACAAAACT AT T GAAGGC ACAGC CCGAGGT GGAGGG 1755 

Qy 1732 GAGGACTTT GAAGACACATAT GGGGAGTTGGAATTCAAGAATGAT GAAACTGT 1784 



Db 



II I II I I I I I I I I I I I III III I I I I I I I I I I I I I I I I I I II 
1756 GAAGACTTT GAGGAC AC CT GT GGAGAGCT CGAATTC CAGAAC GAT GAAAT AGT 1808 



RESULT 12 

BI522813 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



ORIGIN 



BI522813 792 bp mRNA linear EST 29-AUG-2001 

603175911F1 NIH_MGC_121 Homo sapiens cDNA clone IMAGE: 5240066 5', 
mRNA sequence. 
BI522813 

BI522813.1 GI: 15347605 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 792) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 

Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Life Technologies, Inc. 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http : / /image . llnl . gov 
Plate: LLAM11605 row: f column: 03 
High quality sequence stop: 778. 

Location/Qualifiers 

1. .792 

/organism= M Homo sapiens" 

/mol_type= M mRNA" 

/db_xref="taxon:9606 M 

/clone=" IMAGE: 5240066" 

/lab_host="DH10B" 

/clone_lib="NIH_MGC_121" 

/note="Organ: brain; Vector: pCMV-SPORT6; Site_l: NotI; 
Site_2: EcoRV (destroyed); RNA source anonymous pool of 3 
fetal brains, female age 20 weeks, female age 24 weeks, 
and male age 26 weeks. Library is oligo-dT primed and 
directionally cloned (EcoRV site is destroyed upon 
cloning) . Average insert size 1.7 kb, insert size range 
0.7-3.5 kb. Library is normalized and enriched for 
full-length clones and was constructed by C. Gruber 
(Invitrogen) . Research Genetics tracking code 017. Note: 
this is a NIHJVIGC Library." 



Query Match 39.7%; 
Best Local Similarity 98.7%; 
Matches 767; Conservative 



Score 739.8; DB 4 
Pred. No. l.le-200 
0; Mismatches 7 



Length 792; 

Indels 3; Gaps 2; 



Qy 



993 CTT AGAT CAGCT GGT GGAGAT GGC CAAT TACTAT GCTCTTTCC C AC CAACAGAAGAGC CG 1052 
I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1 CTT AGAT CAGCT GGTGGAGAT GGC CAATT ACT AT GCT CTTTC CCACCAAC AGAAGAGCCG 60 

1053 C GC CTT CT ACC GT ATCCAAGCCACT CGT AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAA 1112 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 C GC CTT CT ACC GT ATC CAAGCCACT C GT AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAA 120 

1113 ACAT GCAGCAGAACAAGCCAAGAAGGCCT CCAGCATGAGCGAGGTGCACACCGATGAGCC 1172 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

ACAT GCAGC AGAACAAGC CAAGAAGGCCT CC AGC ATGAGC GAGGT GCACAC CGAT GAGCC 



121 



1173 T GAGGACTT T ATT T CCAAGGT CTT CT TTGACCCAT GTT CT T AC CAGT GCCT GGAGAACTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T GAGGACTT T ATT T CCAAGGT CTT CT TTGAC CC AT GTT CTT AC CAGT GCCT GGAGAACT G 



181 



1233 



241 



TGGGGCTGTACTCCTGACAGTGGT GAGGAAAGGGGGAGACATGTCAAAGACCAT GTATGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1. 1 I I I I I I I I I I I I I I I I I I I I I I 
T GGGGCT GT ACT C CT GACAGT GGT GAGGAAAGGGGGAGACAT GT CAAAGAC CAT GTATGT 



180 



1232 



240 



1292 



300 



1293 GGACTACAAAACAGAGGAT GGTTCTGCCAATGCAGGGGCTGACTAT GAGTTCACAGAGGG 1352 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGACTACAAAACAGAGGAT GGTTCTGCCAATGCAGGGGCTGACTAT GAGTT CACAGAGGG 360 



301 



1353 



361 



CACGGTGGTTCT GAAGCCAGGAGAGACCCAGAAGGAGTTCTCCGTGGGCATAATTGAT GA 1412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CACGGTGGTTCT GAAGCCAGGAGAGACCCAGAAGGAGTTCTCCGT GGGCATAATTGAT GA 420 



1413 C GACATTT T TGAGGAGGAT GAACACTT CTTT GTAAGGTT GAGCAAT GT CCGCATAGAGGA 1472 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 C GACATTT TT GAGGAGGAT GAACACTT CTT T GTAAGGTT GAGCAAT GT CCGCATAGAGGA 480 



1473 GGAGCAGCCAGAGGAGGGGATGCCTCCAGCAATATTCAACAGTCTTCCCTTGCCTCGGGC 
I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 GGAGCAGCCAGAGGAGGGGATGCCTCCAGCAATATTCAACAGTCTTCCCTTGCCTCGGGC 



1533 



541 



1593 



601 



1653 



661 



1712 



721 



T GT C CT AGCCT CCC CTT GT GT GGC C ACAGT TACCATCTT GGAT GAT GACCAT GC AGGC AT 
I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
T GT C CT AGCCT CCC CTT GT GT GGCCACAGTT ACCAT CT T GGAT GAT GACCAT GC AGGCAT 

CTT C ACTTT T GAAT GT GAT ACTATT CATGT CAGTGAGAGT AT T GGT GT T AT GGAGGTCAA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTT C ACTTT T GAAT GT GATACT ATT CAT GT CAGT GAGAGT AT T GGT GTT AT GGAGGT CAA 



1532 



540 



1592 



600 



1652 



660 



GGTT CT GCGGACAT CAGGT GC C CGGGG-T ACAGT CAT C GT CC C CTTT AGGACAGT AGAAG 1711 

I I I I I I I I II II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGTT CT GC GGACAT CAGGT GCACGGGGCT AC AGT CAT C GT CC C CTT T AGGACAGT AGAAG 720 

GGACAGCCAAGGGT GGCGGT — GAGGACTT T GAAGACAC AT AT GGGGAGTT GGAATT 1766 
I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGACAGCCAAGGGT GGCGGTC GACGGACT CT GAAGACAC AT AT GGGGAGTT T GGAAT 777 



RESULT 13 
BX368185 

LOCUS BX368185 916 bp mRNA linear EST 26-APR-2004 

DEFINITION BX368185 Homo sapiens NEUROBLASTOMA COT 50-NORMALIZED Homo sapiens 

cDNA clone CS0DD006YJ07 5-PRIME, mRNA sequence. 
ACCESSION BX368185 



VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BX368185.2 GI: 46572003 
EST. 

Homo sapiens (human) 
Homo sapiens 
Eukaryota; Metazoa; 
Mammalia ; Eutheria ; 
1 (bases 1 to 916) 
Li,W. B. , Gruber, C. , 



Chordata; Craniata; Vertebrata; Euteleostomi ; 
Primates; Catarrhini; Hominidae; Homo. 



and Polayes,D. 



FEATURES 

source 



Jessee, J. 

Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 8, 2003 this sequence version replaced gi: 30445119. 
Contact : Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
7256. r 

For more information about this cluster, see 

http : //www. genoscope . ens . f r/cdna?s=CS0BAA006ZD07_CS00533_2&c=7256 . r 

Location/Qualifiers 
1. .916 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DD006YJ07" 

/ tissue_type="NEUROBLASTOMA COT 50-NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 50-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 39.6%; 
Best Local Similarity 95.1%; 
Matches 827; Conservative 



Score 737.8; DB 5; 
Pred. No. 4.2e-200; 
0; Mismatches 33; 



Length 916; 
Indels 10; 



Qy 

Db 



Gaps 



6; 



46 



ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 105 



Qy 



Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
106 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 165 



Qy 

Db 



121 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 180 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
166 AC AGGGCAGAACAAT GAGT CCT GT T C AGGGT C AT CGGACT GCAAGGAGGGT GT CAT C CT G 225 



Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 226 CCAAT CT GGT AC C C GGAGAAC CCTTCCCTT GGGGACAAGATTGC CAGGGT CATT GT CT AT 285 



Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 286 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 345 

Qy 301 TCTATTGAAGTCATCACCTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I 
Db 346 T CT AT T GAAGTC ATCACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAA 405 

Qy 361 ACCAGCACAACC ACT ATT CGGGT CT GGAAT GAAACT GT CT C CAAC CT GACCCTT AT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 406 ACCAGCACAACCACT ATT C GGGT CT GGAAT GAAACT GT CT C CAACCT GACC CTTAT GGC C 465 

Qy 421 CT GGGT TCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGT CAT GGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I II I II I I I I I I II I I I I I I I I I I I 
Db 466 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 525 

Qy 481 ATT GCT GGT GAT CTGGGAC CTT CT ACCATT GTAGGGAGT GC AGC CTT CAACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 526 AT T GCT GGT GAT CTGGGACCTT CT ACCATT GTAGGGAGT GC AGC CTT CAACAT GTT CAT C 585 

Qy 541 AT CATT GGCATCTGT GTCTACGT GATCCCAGACGGAGAGACT CGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 586 ATCATTGGCATCT GT GTCTACGT GATCCCAGACGGAGAGACT CGCAAGAT CAAGCATCTA 645 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 646 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 705 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I III 
Db 706 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCT-CTCACTCTCTTTTTC 764 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I II I I II III I 
Db 765 -TTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGAT-AACGACTGGTTTTTACCAA — TC 820 

Qy 781 AT GC ACAAAAAGT AC C GC ACAGACAAACAC C GAGGAAT TAT CAT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I II I II I I I I III I II I 

Db 821 ATGC CCAAAAAGT CC C G- ACAGAC CAACC C GN GGGAT T T TCTAGAGACCGAGGTGC 875 

Qy 841 CAC C CTAAGGGC ATT GAGAT GGAT GGGAAA 870 

I I I I I I I I I I I I I I I I I I I I I 
Db 876 CCACCCTAGGGCCTTGGGATGGTGGGAAAA 905 



RESULT 14 

AK035163 

LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 



AK035163 4374 bp mRNA linear HTC 03-APR-2004 

Mus musculus 12 days embryo embryonic body between diaphragm region 
and neck cDNA, RIKEN full-length enriched library, clone : 9430095C22 
product: SODIUM/ CALCIUM EXCHANGER 2 PRECURSOR (NA(+) /CA( 2+) -EXCHANGE 
PROTEIN 2) homolog [Rattus norvegicus] , full insert sequence. 
AK035163 

AK035163. 1 GI: 26084435 

HTC; CAP trapper. 

Mus musculus (house mouse) 



ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
MEDLINE 
PUBMED 

REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
REFERENCE 
AUTHORS 



Mus mus cuius 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 

Carninci,P. and Hayashizaki, Y. 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu, M. and Hayashizaki, Y. 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata,K 



Sasaki, N. , Carninci,P. 
, Tashiro,H., Itoh,M., 
Nishine,T., Harada,A. , 



TITLE 
JOURNAL 



Itoh,M., Aizawa,K., Nagaoka,S., 
Konno,H., Akiyama,J., Nishi,K., Kitsunai,T. 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M. 
Yamamoto,R., Matsumoto, H . , Sakaguchi, S . , Ikegami,T., Kashiwagi, K. , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M. , Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu, M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 
RIKEN integrated sequence analysis (RISA) system — 384-format 
sequencing pipeline with 384 multicapillary sequencer 
Genome Res. 10 (11), 1757-1771 (2000) 
20530913 
11076861 
4 . 

The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 
of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 4374) 

Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci,P., 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A., Hashizume, W. , 
Hayashida, K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M., Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A., Murata,M., 
Nakamura,M., Nishi,K., Nomura, K., Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H., Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki, D., Shibata,K., Shinagawa, A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A., Takahashi, F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A., Toya,T., Yasunishi, A. , 
Muramatsu, M. and Hayashizaki, Y. 
Direct Submission 

Submitted ( 16- JUL-2001) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN), Laboratory for Genome 



COMMENT 



FEATURES 

source 



misc feature 



Exploration Research Group / RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-resSgsc. riken. jp, 
URL: http: //genome. gsc. riken. jp/, Tel : 81-45-503-9222, 
Fax:81-45-503-9216) 

cDNA library was prepared and sequenced in Mouse Genome 
Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Please visit our web site for further details. 
URL: http: / /genome . gsc. riken. jp/ 
URL: http: / /fantom. gsc . riken. jp/ . 

Location/Qualifiers 

1. .4374 

/organism="Mus mus cuius" 
/mol_type="mRNA" 
/strain="C57BL/6J" 
/db_xref="FANTOM_DB : 9430095C22" 
/db_xref="taxon: 10090" 
/clone="9430095C22" 

/tissue_type="embryonic body between diaphragm region and 
neck" 

/clone_lib=" RIKEN full-length enriched mouse cDNA library" 
/dev_jstage="12 days embryo" 
281. .3046 

/note="SODIUM/CALCIUM EXCHANGER 2 PRECURSOR 
(NA( + ) /CA( 2+) -EXCHANGE PROTEIN 2) homolog [Rattus 
norvegicus] (SWISSPROT | P48768, evidence: FASTY, 97%ID, 
100%length, match=2763) 
putative" 



ORIGIN 



Query Match 38.1%; 
Best Local Similarity 65.9%; 
Matches 1092; Conservative 



Score 710.4; DB 3; 
Pred. No. 6.1e-192; 
0; Mismatches 536; 



Length 4374; 
Indels 30; Gaps 



3; 



Qy 



Db 



136 GAGT C CT GTT C AGGGT C AT CGGACT GCAAGGAGGGT GT CAT CCT GCCAATCT GGT ACCC G 195 

I I Ml I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

401 GAAGGCTGCCAAGGTTCCTACCGCTGCCAACCAGGTGTGCTGCTGCCTGTGTGGGAACCC 460 



Qy 

Db 



196 GAGAACC CTT CC CTT GGGGACAAGAT T GC CAGGGT CAT T GT CT ATT T T GT GGCC CTGAT A 255 

III I I I I II II II I I I I I I I I I I III I I II II I I I I I I I I I II I 
461 GAGGACCCATCGCTGGGCGACAAGGTTGCACGGGCCGTGGTGTACTTTGTGGCCATGGTC 520 



Qy 

Db 

Qy 

Db 

Qy 

Db 



256 T AC AT GTT CCT T GGGGTGT CC AT CAT T GCT GAC CGCTT C AT GGC AT CT AT T GAAGT CAT C 315 

I I I I I II I II I II I I I I I I I I I I I I I II I I II I I I I I I I I I I II I I I I I I I 
521 T ACAT GT T C CT GGGT GT GT CT ATC AT T GC CGAT CGATT T AT GGC AT C CATT GAGGT CAT C 580 

316 ACCTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAAACCAGCACAACCACT 375 

I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I III 
581 ACAT CCAAGGAGAAAGAGAT C ACC AT CAC CAAGGCAAATGGGGAGAC C AGCGTGGGCAC G 640 

376 ATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCT 435 

I II I I I I I I I II II II I I I I I I I I II II I I I I I I I I I I I I I I I I II 
641 GTGCGCATCTGGAACGAGACGGTGTCCAACCTTACACTCATGGCCCTGGGCTCCTCAGCG 700 



436 C CT GAGATACTC CTCT CTT TAATT GAGGT GT GT GGT CAT GGGTTCATT GCT GGT GAT CT G 495 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I 

701 CCT GAGATT CTGT TGACT GTC AT C GAGGT CT GT GGCCACAACTT CCAGGCC GGT GAGCT A 760 

496 GGACCTT CT ACCATT GTAGGGAGT GCAGC CT T CAACAT GTT CAT CAT CATT GGCAT CT GT 555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

761 GGCCCAGGCACCATCGTGGGCAGTGCCGCCTTCAACATGTTTGTGGTCATTGCTGTTTGT 820 

556 GTCTACGTGATCCCAGACGGAGAGACT CGCAAGAT CAAGCAT CTACGAGTCTT CTT CATC 615 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II 

821 GT GT AT GT CAT CC C GGCT GGCGAGAGC CGTAAGAT CAAGC AC CT GAGGGT CTT CTTT GT C 880 

616 ACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCC 675 

II II I I I I II I I I II I I I I I I I I I I I I I III I I I I I I Mill I I I I I I 

881 ACAGCCTCCTGGAGCATCTTTGCCTATGTCTGGCTTTATCTCATTCTAGCAGTTTTCTCC 940 

676 CCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTC 735 

II I I I I I I I I I I I I I I II I I I II I I I I I II I I I I I I I II II I I I I I I 
941 CCAGGTGTAGTCCAGGTGTGGGAGGCACTGCTCACACTGATCTTCTTCCCGGTGTGTGTG 1000 

736 CTT CTGGCCT GGGTGGCAGATAAAC GACT GCT CT T CT ACAAAT ACAT GC ACAAAAAGT AC 795 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
1001 GT GTTT GCCT GGATGGCGGACAAGC GACT GCT CT T CT ACAAGT ACGT GTACAAGCGCTAC 1060 

796 C GCACAGACAAACACC GAGGAATT AT C AT AGAGAC AGAGGGT GACCAC CCTAAGGGCAT T 855 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1061 C GC ACCGAC CCT C GCAGT GGAAT CAT CAT C GGGGC AGAGGGAGACCCACCCAAGAGCAT C 1120 

856 GAGAT GGATGGGAAAATGATGAATT CCCATTTTCTAGATG GGAACCTG 903 

I I I I I I I I I I I I I I I I I I I . I II 

1121 GAGCTGGACGGCACATTCGTGGGCACTGAGGTCCCTGGCGAGCTGGGCGCATTGGGCACA 1180 

904 GTGC CCCTGGAAGGGAAGGAAGT GGAT GAGT C CCGCAGAGAGAT GAT CCGGATT CT CAAG 963 

I II I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I 
1181 GGT CCT GCT GAGGCGCGTGAACTAGATGCCAGCCGGCGT GAGGT CAT CCAGATCCTTAAG 1240 

964 GAT CT GAAGCAAAAAC AC CCAGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGCCAATTAC 1023 

II I I I I.I I I. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1241 GACTTGAAGC AGAAGC AC CCGGATAAGGACCT GGAGC AGCT GAT GGGCAT CGC CAAGTAC 1300 

1024 TAT GCT CTTT CC CAC CAACAGAAGAGCC GC GCCTT CT ACCGT AT CCAAGCCACT CGT AT G 1083 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II II 

1301 T AT GCACTGCT GCAC CAGCAGAAGAGCC GC GC CT T CTACCGCAT CCAGGCC AC GCGGCT G 1360 

1084 ATGACT GGT GCAGGCAAT ATC CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCCT C C 1143 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I -111 II I 

1361 ATGACAGGTGCGGGCAATGTGCTGCGCAGACATGCTGCGGATGCTGCCCGCAGG CCG 1417 

1144 AGCATGAGCGAGGT GC ACAC CGAT GAGCCT GAGGACTT T ATTTC CAAGGT CTT CTTT GAC 1203 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1418 GGAGCCACCGAT GGT GCCC C C GAT GAT GAGGAC GAT GGTGC CAGT CGCAT CTT CTT T GAG 1477 

1204 C CAT GT T CT T AC CAGT GC CT GGAGAACT GT GGGGCT GT ACT C CT GACAGT GGT GAGGAAA 1263 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1478 CCCAGCCTCTATCACTGCCTGGAAAACTGCGGGTCAGTGCTGCTGTCCGTGGCTTGCCAG 1537 



1264 GGGGGAGACATGT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GC CAAT 1323 



1538 GGCGGTGAGGGCAACAGCACCTTCTACGTGGACTACCGTACCGAGGACGGTTCTGCAAAG 1597 



Qy 1324 GCAGGGGCT GACT ATGAGTT CACAGAGGGCACGGT GGTTCT GAAGC CAGGAGAGACCC AG 1383 

I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1598 GCAGGCT C CGAT T ATGAGT ACAGC GAGGGCAC GCT GGT GT T CAAGC C C GGGGAGAC GC AG 1657 

Qy 1384 AAGGAGTTCTCCGTGGGCATAATT GATGACGACATTTTTGAGGAGGAT GAACACTT CTTT 1443 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1658 AAGGACCTGCGCAT CGGGATCATCGACGACGACATCTT CGAGGAGGAT GAGCACTT CTTC 1717 

Qy 1444 GT AAGGTT GAGCAATGT C C GCAT AGAGGAGGAGCAGC CAGAGGAGGGGAT GCCT CCAGC A 1503 

I I I I I I I II III II III III I II 
Db 1718 GTGAGGCTGCTGAACCTGCGTGTGGGCGATGCTCAGGGCATGTTCGAG 1765 

Qy 1504 ATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTT 1563 

I II I I III I I III I I I I I I I I I I I I 

Db 1766 CCCGACGGCGGTGGGCGGCCCAAGGGGCGGCTGGTGGCGCCGCTGCTGGCCACTGTC 1822 

Qy 1564 ACCAT CT T GGAT GAT GACCAT GCAGGC AT CTT CACTTT T GAAT GT GAT ACT AT T CAT GT C 1623 

I I I I I I I I I I II I I I II II I I I I II I I I I I I I I I I I I I 

Db 1823 ACCAT C CT GGAC GACGAC CAC GCGGGC AT CTT CT C CTT CCAGGACC GC CT GCT GCAT GT G 1882 

Qy 1624 AGT GAGAGT ATT GGTGTTAT GGAGGT CAAGGTT CT GC GGAC AT CAGGT GCCC GGGGTAC A 1683 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1883 AGCGAGTGCATGGGCACTGTGGATGTGCGCGTGGTTCGCAGCTCGGGCGCCCGTGGCACT 1942 

Qy 1684 GTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTTGAA 1743 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 1943 GTACGCCTCCCCTACCGCACAGTGGACGGCACGGCCCGTGGCGGTGGTGTACATTACGAG 2002 

Qy 1744 GACAC AT AT GGGGAGT T GGAATT CAAGAAT GAT GAAAC 1781 

N I I I I I I I I I I II I I I II I I I I I I I 

Db 2003 GAT GCTT GT GGAGAGCT GGAGTTCGGC GAT GAT GAGAC 2040 



RESULT 15 

BX390204 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BX390204 894 bp mRNA linear EST 28-APR-2004 

BX390204 Homo sapiens NEUROBLASTOMA COT 50-NORMALIZED Homo sapiens 
cDNA clone CS0DD006YJ07 5-PRIME, mRNA sequence. 
BX390204 

BX390204.2 GI: 46834875 
EST. 

Homo sapiens (human) 
Homo sapiens 
Eukaryota ; Metazoa ; 
Mammalia ; Eutheria ; 
1 (bases 1 to 894) 
Li, W. B. , Gruber, C. , 



Chordata; Craniata; Vertebrata; Euteleostomi; 
Primates; Catarrhini; Hominidae; Homo. 



Jessee, J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 8, 2003 this sequence version replaced gi: 30461412. 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqrefQgenoscope.cns.fr, Web : www.genoscope.cns.fr 



1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
7256. r " - 

For more information about this cluster, see 

http: //www.genoscope. ens . f r/cdna?s=CS0BAG010ZAll_CS00945 l&c=7256. r 



FEATURES 

source 



Location/Qualifiers 
1. .894 

/organism= ,f Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/ clone=" CS 0DD0 0 6 Y JO 7 " 

/tissue_type="NEUROBLASTOMA COT 50 -NORMAL I ZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 50 -NORMAL I ZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 38.0%; 
Best Local Similarity 93.3%; 
Matches 838; Conservative 



Score 708.4; DB 5; 
Pred. No. 1.2e-191; 
0; Mismatches 51; 



Length 894; 



Indels 



9 ; Gaps 



9; 



Qy 

Db 



30 CTCTGCCTTCCTCCATTTTGGGCTGGTTACCTTTGTGCTCTTCCTGAATGGTCTTCGAGC 89 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1 CTCTGCCTTCCTCC-TTTTGGGCTGGTTACCTTTGTGCTCTTCCTG-ATGGTCTTCGAGC 58 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



90 AGAGGCT GGT GGCT CAGGGGAC GT GC CAAGCACAGGGCAGAACAAT GAGT C CTGT TCAGG 149 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

59 AGAGGCT GGT GGCT CAGGGGAC GT GC CAAGCACAGGGCAGAACAAT GAGT C CT GT T C AGG 118 

150 GTCATCGGACTGCAAGGAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCT 209 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

119 GT C AT CGGACT GCAAGGAGGGT GT CAT C CT GC CAAT CT GGT AC C CGGAGAAC CCTTCC CT 178 

210 TGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGG 269 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

179 T GGGGACAAGATT GC CAGGGT CAT T GT CT ATTT TGT GGCCCTGATAT ACAT GTT C CTT GG 238 

270 GGT GT CCATCAT T GCT GACCGCT T CAT GGCAT CTAT T GAAGTCAT CACCT CT CAAGAGAG 329 

I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

239 GGTGTCCATCATT.GCT GACCGCTTCAT GGCAT CTATTGAAGTCATCACCTCTCAAGAGAG 298. 

330 GGAGGT GACAATTAAGAAACCCAATGGAGAAACCAGCACAACCACTATT CGGGTCTGGAA 389 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
299 GGAGGTGACAATTAAGAAACCCAATGGAGAAACCAGCACAACCACTATTCGGGTCTGGAA 358 

390 TGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCT 449 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

359 TGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCT 418 



Qy 



450 CTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCAT 509 
I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 419 CTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCAT 478 

Qy 510 T GT AGGGAGT GCAGCCTT CAACAT GTT CAT CAT CATT GGCAT CTGT GT CT ACGT GATCC C 569 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 479 T GT AGGGAGT GCAGCCTTCAACAT GTT CAT CAT CATT GGCAT CTGT GT CT ACGT GATCCC 538 

Qy 570 AGACGGAGAGACT CGCAAGAT CAAGCAT CT AC GAGTCTT CTT C AT CAC CGCT GCTT GGAG 629 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 539 AGACGGAGAGACT CGCAAGAT CAAGC ATT T AC GAGTCT T CTT CAT CAC CGCTGCTT GGAG 598 

Qy 630 TATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCA 689 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 599 TATCTTTGCCTACATCTGGCTCTATATGATTCTGCCAGTCTTCTCCCCTGGTGTGGTCCA 658 

Qy 690 GGTTT-GGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTG-TCCTTCTGGCCTGG 747 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II III I I I I I I I I I II II III I I I I 
Db 659 GGTTTGGGGAAGGCCTCCTCACTCTCTTTTTTTTTTCAGTGTGTGTTCTTTTTGGTCTGG 718 

Qy 748 GT GGC AG- AT AAAC GACT GCT - CTT CT ACAAAT ACAT GCACAAAAAGT ACC GCACAGACA 805 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I II I I I I I II I I I I I I I I I I I 
Db 719 GT GGCAGT AT AACC GACT GCT C CTT T T ACAAAT ACAT GCACAT TAAT GT CC GCACAGACA 778 

Qy 806 AACACCGAGGAATTATCATAGAGACAGAGGGT GACCACCCTAAGGGCATTGAGATGGAT G 865 

I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II II 
Db 779 ACCACCG- GGCACTTT CAT T GAGACT GTC GTT G- C CAC C CT T AGGGCACT GAGA- GGTT G 835 

Qy 866 GGAAAAT GAT GAATTCC CAT T TTCTAGAT GGGAAC CT GGT GC C CCT GGAAGGGAAGGA 923 

I I I I I I I I I I I II I I II II II INI III II I I I I 

Db 836 GGCAAAT GAT GAT TTC CACT T C CT T ATTT GT AT CCCTGCGCCT CTT TAAGGCAAAGAA 893 



Search completed: January 22, 2005, 17:29:22 
Job time : 5799.24 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2005 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: 



January 22, 2005, 06:33:49 ; Search time 7895.51 Seconds 

(without alignments) 
11158.325 Million cell updates/sec 



Title: 

Perfect score: 
Sequence : 



US-10-054-680-3 
1863 

1 atggcgtggttaaggttgca ggaaagccagtattgggtga 1863 



Scoring table: 



IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 



4526729 seqs, 23644849745 residues 



Total number of hits satisfying chosen parameters: 



9053458 



Minimum DB seq length: 
Maximum DB seq length: 



2000000000 



Post-processing: 



Database 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 

GenEmbl:* 
1: gb_ba:* 
2 
3 
4 
5 
6 
7 
8 
9 

10 
11 
12 
13 
14 



gb_htg : 
gb_in : * 
gb_om: * 
gb_o v : * 
gb_pat : * 
gb_ph : M 
gb_pl : 
gb_pr : 
gb_ro : * 
gb_sts:* 
gb_sy : * 
gb_un : * 
gb_vi : * 



: * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 



% 

Result Query 

No. Score Match Length DB 



SUMMARIES 



ID 



Description 



1 1863 100.0 1863 6 AX496813 

2 1861.4 99.9 5146 9 AF510503 

3 1784.6 95.8 2766 6 AX496811 



AX496813 Sequence 
AF510503 Homo sapi 
AX496811 Sequence 



4 


1784.6 


95. 


8 


3812 


6 


AX496815 


AX496815 Sequence 


5. 


1784.4 


95. 


8 


2534 


9 


HSNCX22 


X93017 Homo sapien 


6 


1783 


95. 


7 


2781 


6 


AX299471 


AX299471 Sequence 


7 


1783 


95. 


7 


2782 


6 


AX476818 


AX476818 Sequence 


8 


1783 


95. 


7 


2837 


9 


HSA304853 


AJ304853 Homo sapi 


9 


1783 


95. 


7 


2966 


6 


AX480881 


AX480881 Sequence 


10 


1783 


95. 


7 


5250 


9 


AF510501 


AF510501 Homo sapi 


11 


1783 


95. 


7 


5268 


9 


AF510502 


AF510502 Homo sapi 


12 


1782.8 


95. 


7 


1788 


6 


CQ736275 


CQ736275 Sequence 


13 


1782.8 


95. 


7 


126512 


6 


AX476820 


AX476820 Sequence 


14 


1782.8 


95. 


7 


145118 


9 


AF508982 


AF508982 Homo sapi 


15 


1782.8 


95. 


7 


146055 


2 


AC009607 


AC009607 Homo sapi 


16 


1782.8 


95. 


7 


206256 


9 


CNS01RGT 


AL160191 Human chr 


17 


1782.4 


95.7 


2840 


9 


HSA304852 


AJ304852 Homo sapi 


18 


1546.2 


83. 


0 


4640 


10 


BC052435 


BC052435 Mus muscu 


19 


1544.4 


82. 


9 


183707 


10 


AC124384 


AC124384 Mus muscu 


20 


1544 


82. 


9 


1784 


10 


AF321404 


AF321404 Mus muscu 


21 


1544 


82. 


9 


3435 


10 


AF453257 


AF453257 Mus muscu 


22 


1527 


82. 


0 


4854 


10 


RNU53420 


U53420 Rattus norv 


23 


1526.8 


82. 


0 


247722 


2 


AC099080 


AC099080 Rattus no 


24 


1331.4 


71. 


5 


3838 


9 


HSA508602 


AJ508602 Homo sapi 


25 


1030.4 


55. 


3 


2959 


5 


BC076761 


BC076761 Xenopus 1 


26 


938.6 


50. 


4 


77568 


2 


AC139418 


AC139418 Homo sapi 


27 


913.2 


49. 


0 


77568 


2 


AC139418 


AC139418 Homo sapi 


28 


895.8 


48. 


1 


248965 


2 


CR361558 


CR361558 Danio rer 


29 


810.6 


43. 


5 


4087 


4 


BOVEXCHANG 


L06438 Bos taurus 


30 


810.6 


43. 


5 


4087 


6 


AX360315 


AX360315 Sequence 


31 


805.2 


43. 


2 


3199 


4 


DOGSNCE 


M57523 Dog cardiac 


32 


799.4 


42. 


9 


3150 


4 


CATSCE 


L35846 Felis catus 


33 


796.2 


42. 


7 


3292 


4 


OCU52665 


U52665 Oryctolagus 


34 


795 


42. 


7 


1920 


4 


FCNCX1S4 


U67075 Felis catus 


35 


792.8 


42. 


6 


1832 


9 


AF109888 


AF109888 Macaca mu 


36 


792.8 


42. 


6 


2965 


9 


AF107593 


AF107593 Macaca mu 


37 


786.4 


42. 


2 


3184 


9 


HUMNACAA 


M96368 Homo sapien 


38 


785.2 


42. 


1 


1836 


6 


CQ073597 


CQ073597 Sequence 


39 


785.2 


42. 


1 


1836 


6 


CQ104484 


CQ104484 Sequence 


40 


785.2 


42. 


1 


1836 


6 


CQ178689 


CQ178689 Sequence 


41 


785.2 


42. 


1 


1836 


6 


CQ226382 


CQ226382 Sequence 


42 


785.2 


42. 


1 


1836 


6 


CQ264524 


CQ264524 Sequence 


43 


785.2 


42. 


1 


1836 


6 


CQ301620 


CQ301620 Sequence 


44 


785.2 


42. 


1 


1836 


6 


CQ338834 


CQ338834 Sequence 


45 


785.2 


42. 


1 


2129 


9 


HSNCX12 


X91213 H. sapiens n 



ALIGNMENTS 



RESULT 1 
AX496813 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



AX496813 
Sequence 
AX496813 
AX496813. 



1863 bp 
3 from Patent WO02059316. 

1 GI:23342336 



(human) 



DNA 



linear PAT 26-SEP-2002 



Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 



Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
REFERENCE 1 

AUTHORS Hilbun,E. and Friddle,C.J. 

TITLE Human ion exchanger proteins and polynucleotides encoding the same 

JOURNAL Patent: WO 02059316-A 3 01-AUG-2002; 
LEXICON GENETICS INC (US) 
FEATURES Location/Qualifiers 
source 1. .1863 

/organism="Homo sapiens" 
/mol_type="unas signed DNA" 
/db_xref="taxon:9606" 

ORIGIN 

Query Match 100.0%; Score 1863; DB 6; Length 1863; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1863; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 AC AGGGC AGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 ACAGGGC AGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GTC AT CCT G 180 

Qy 181 CCAAT CT GGT AC CC GGAGAACC CT T C C CTT GGGGACAAGATT GCCAGGGT C ATT GT CTAT 240 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAAT CT GGT AC CC GGAGAACCCT T C C CTT GGGGACAAGATT GCCAGGGT C ATT GT CTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAAT TAAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAACC CAAT GGAGAA 360 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 361 ACCAGC ACAAC C ACT AT T CGGGTCT GGAAT GAAACT GT CT C CAAC CT GACC CTT AT GGC C 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I It I I I I 

Db 481 ATTGCT GGT GAT CT GGGAC CT T CT AC CATT GT AGGGAGT GC AGCCT T CAACAT GT T CAT C 540 

Qy 541 ATCATTGGCATCTGTGTCTACGTGATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 600. 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 AT CAT T GGCAT CT GT GT CT AC GTGAT C CC AGACGGAGAGACT CGCAAGAT CAAGC AT CT A 600 



Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I II I 

Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 ATGCACAAAAAGT AC CGCACAGACAAACAC C GAGGAATT AT CAT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I 

Db 781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

Qy 841 CACCCTAAGGGCATT GAGATGGATGGGAAAATGATGAATT CCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 CACCCTAAGGGCATT GAGATGGAT GGGAAAAT GAT GAATT C CCAT TTT CT AGAT GGGAAC 900 

Qy 901 CT GGT GC CC CTGGAAGGGAAGGAAGT GGAT GAGT CCCGCAGAGAGAT GAT C CGGATT CT C 960 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I 

Db 901 CT GGTGC CC CTGGAAGGGAAGGAAGT GGAT GAGT CC CGCAGAGAGAT GAT C CGGATT CT C 960 

Qy 961 AAGGAT CTGAAGCAAAAAC AC CCAGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 AAGGAT CT GAAGCAAAAAC ACCC AGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGCCAAT 1020 

Qy 1021 TACTAT GCT CTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTAT CCAAGCCACT CGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 TACTAT GCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACT CGT 1080 

Qy 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAAC AT GCAGC AGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGC AGAACAAGC CAAGAAGGCC 1140 

Qy 1141 T C C AGCATGAGCGAGGT GCACACCGAT GAGC CT GAGGACTTT AT TT C CAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 T CC AGC ATGAGC GAGGT GCACACC GAT GAGC CT GAGGACTTTATTTC CAAGGT CTT CTTT 1200 

Qy 1201 GAC C CAT GTT CTT AC C AGT GCCT GGAGAACT GT GGGGCT GT ACT CCT GAC AGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 GACC CAT GTT CTT AC CAGT GCCTGGAGAACT GT GGGGCT GT ACT CCT GAC AGT GGT GAGG 1260 

Qy 1261 AAAGGGGGAGACATGTCAAAGACCATGTAT GT GGACTACAAAACAGAGGATGGTT CTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I U.I. 

Db 1261 AAAGGGGGAGACATGT CAAAGAC CAT GT AT GT GGACT ACAAAAC AGAGGAT GGT T CT GCC 1320 

Qy 1321 AATGCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCAC GGT GGT T CT GAAGCCAGGAGAGACC 1380 

Qy 1381 CAGAAGGAGTT CT CC GT GGGCATAATT GAT GAC GACATT TTT GAGGAGGAT GAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CAGAAGGAGTTCT CCGTGGGCATAATTGATGACGACATTTTTGAGGAGGAT GAACACTTC 1440 

Qy 1441 T TT GTAAGGT TGAGCAAT GTC CGCAT AGAGGAGGAGC AGCCAGAGGAGGGGAT GC CT C C A 1500 



Db 



1441 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I II I I I I I I I I I I I I I I I 
TTT GTAAGGTT GAGCAAT GTCCGCAT AGAGGAGGAGCAGC CAGAGGAGGGGAT GCCT CCA 1500 



Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GTTACCATCTTGGATGATGACCATGCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GTT AC CAT CTT GGATGAT GACCAT GCAGGCAT CTT CACTT TT GAAT GT GAT ACT ATTCAT 1620 

Qy 1621 GTCAGT GAGAGT AT TGGT GTT ATGGAGGT CAAGGT T CT GCGGACAT CAGGT GCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GTCAGT GAGAGT AT TGGT GTT ATGGAGGT CAAGGTT CT GC GGACAT CAGGTGCCCGGGGT 1680 

Qy 1681 ACAGT CAT C GT C CC CTTT AGGACAGT AGAAGGGACAGC CAAGGGT GGC GGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 ACAGT CAT CGTCCCCTTTAGGACAGT AGAAGGGACAGC CAAGGGT GGCGGTGAGGACTTT 1740 

Qy 1741 GAAGACACAT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACT GT ATGT GACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GTAT GT GACAGACAGGAA 1800 

Qy 1801 GCT GACT AT GGAAGAAGAGGAGGCCAAGAGGAT AGCAGAGAT GGGAAAGC CAGT AT TGGG 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 GCT GACT AT GGAAGAAGAGGAGGCCAAGAGGAT AGCAGAGAT GGGAAAGCCAGT AT TGGG 1860 

Qy 1861 TGA 1863 

I I I 

Db 1861 TGA 1863 



RESULT 2 
AF510503 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 



AF510503 5146 bp mRNA linear PRI 30-OCT-2002 

Homo sapiens Na+/Ca2+ exchanger isoform 3 splice variant 4 (SLC8A3) 
mRNA, complete cds; alternatively spliced. 
AF510503 

AF510503.1 GI:24421224 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 5146) 

Gabellini,N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli,E. 

The human SLC8A3 gene and the tissue-specific Na(+)/Ca(2+) 

exchanger 3 isoforms 

Gene 298 (1) , 1-7 (2002) 

22294016 

12406570 

2 (bases 1 to 5146) 
Gabellini,N. , Bortoluzzi, S 
Direct Submission 

Submitted ( 09-MAY-2002) Department of Biology, Unv 
G. Colombo, Padova, PD 35131, Italy 
Location/ Qualifiers 



Danieli,G.A. and Carafoli,E. 

of Padova, via 



source 



gene 
5 1 UTR 
CDS 



3' UTR 

polyA_signal 
ORIGIN 



1. .5146 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref =" taxon : 9606" 

/chromosome="14" 

/map="14q24.2" 

1. .5146 

/gene="SLC8A3" 

1. .754 

/gene="SLC8A3" 
755. .2617 
/gene="SLC8A3" 

/note="NCX3. 4; expressed in skeletal muscle; alternatively 

spliced" 

/codon_start=l 

/product="Na+/Ca2+ exchanger isoform 3 splice variant 4" 
/protein_id="AAN60792 . 1" 
/db_xref="GI: 24421225" 

/translation="MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 

NESCSGSSDCKEGVILPIWYPENPSLGDKIARVI VYFVALIYMFLGVSIIADRFMASI 

EVITSQEREWIKKPNGETSTTTIRVWETVSNLTLMALGSSAPEILLSLIEVCGHGF 

I AGDLGPSTI VGSAAFNMFI 1 1 GI CVYVT PDGETRKI KHLRVFFI TAAWS I FAYIWLY 

MI LAVFS PGWQVWEGLLTLFFFPVCVLLAWVADKRLLFYKYMHKKYRTDKHRGI HE 

TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 

LVT1MANYYALSHQQKSRAFYRIQATRNIMTGAGNILKKHAAEQAKKASSM 

DFISKVFFDPCSYQCLENCGAVljLTVVRKGGDMSKTNrYVT)YKTEDGSANAGADYEFTE 

GTWLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSNVRIEEEQPEEGMPPAIFNSLPL 

P RAVLAS P C VATVT I LDDDHAG I FT FEC DT I HVS ESI GVMEVKVL RT S GARGT VI VP F 

RTVEGTAKGGGEDFEDTYGELEFKNDETVCDRQEADYGRRGGQEDSRDGKASIG" 

2618. .5146 

/gene="SLC8A3" 

5117. .5122 

/gene="SLC8A3" 



Query Match 99.9%; 
Best Local Similarity 99.9%; 
Matches 1862; Conservative 



Score 1861.4; 
Pred. No. 0; 
0; Mismatches 



DB 9; Length 5146; 



1; Indels 



0; Gaps 



0; 



Qy 

Db 



755 



ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 814 



Qy 

Db 

Qy 

Db 

Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

815 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 874 

121 ACAGGGCAGAACAAT GAGT CCT GTTCAGGGTCATCGGACTGCAAGGAGGGT GTCATCCTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

875 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CATCGGACT GCAAGGAGGGT GT CAT C CT G 934 

181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

935 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 994 



Qy 



241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 
I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



995 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 1054 

301 T CT ATT GAAGT CAT C ACCT CT CAAGAGAGGGAGGT GACAATTAAGAAAC C CAAT GGAGAA 360 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

1055 T CT ATT GAAGT CAT C ACCT CT CAAGAGAGGGAGGT GACAATTAAGAAAC CCAAT GGAGAA 1114 

361 AC CAGCACAAC CACT AT T C GGGT CT GGAAT GAAACT GT CT C CAACCT GACC CTT ATGGC C 420 
I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I 

1115 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 1174 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I 

1175 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1234 

481 ATT GCT GGTGAT CT GGGACCT T CT AC CAT T GT AGGGAGT GC AGCCTT CAACATGTT CAT C 54 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1235 ATT GCTGGTGAT CT GGGACCT T CT AC CATT GT AGGGAGT GC AGCCTT CAAC AT GT TCAT C 1294 

541 AT C ATTGGCAT CT GT GT CT AC GT GAT C CCAGAC GGAGAGACTCGCAAGAT CAAGCAT CTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1295 AT CATTGGCATCTGT GTCTACGTGATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 1354 

601 C GAGT CTT CTT CAT C AC C GCT GCTT GGAGT AT CTTT GCCT ACAT CT GGCT CTAT ATGATT 660 

I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1355 CGAGT CTT CT T CAT CACC GCT GCTT GGAGT AT CTTT GCCT ACAT CT GGCT CTAT ATGATT 1414 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1415 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1474 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1475 TT T CCAGT GT GT GT C CTT CTGGCCT GGGT GGCAGATAAAC GACT GCT CTT CT ACAAAT AC 1534 

781 AT GCACAAAAAGT AC C GCACAGACAAAC ACCGAGGAATT AT CAT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1535 AT GCACAAAAAGT AC CGCACAGACAAAC ACCGAGGAATT AT CAT AGAGACAGAGGGT GAC 1594 

841 CAC CCTAAGGGC AT T GAGATGGAT GGGAAAAT GAT GAATTC CC ATT TT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1595 CACCCTAAGGGCATT GAGATGGAT GGGAAAAT GAT GAATT C CC ATT TT CT AGAT GGGAAC 1654 

901 CT GGT GC CCCT GGAAGGGAAGGAAGT GGAT GAGTCC CGC AGAGAGAT GAT CC GGATT CTC 960 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1655 CT GGT GC CCCT GGAAGGGAAGGAAGT GGAT GAGTC C CGCAGAGAGAT GAT CCGGATT CT C 1714 

961 AAGGATCT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCT GGT GGAGATGGCCAAT 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1715 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCT GGT GGAGATGGCCAAT 1774 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I T I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1775 T ACT AT GCTCTT T CC C ACCAACAGAAGAGC CGT GCCTT CT ACCGTAT C CAAGCCACT C GT 1834 



1081 AT GAT GACTGGT GCAGGCAAT AT C CT GAAGAAACAT GC AGCAGAACAAGCC AAGAAGGCC 1140 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1835 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1894 



Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1895 T C CAGCAT GAGCGAGGT GC ACACC GAT GAGCCT GAGGACTTTATTT C CAAGGT CTTCTTT 1954 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1955 GAC CCAT GT T CTT AC C AGTGC CT GGAGAACT GT GGGGCT GT ACT CCT GAC AGT GGTGAGG 2014 

Qy 1261 AAAGGGGGAGACATGTCAAAGACCATGTATGTGGACTACAAAACAGAGGATGGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2015 AAAGGGGGAGAC ATGT CAAAGACCAT GT ATGT GGACTACAAAACAGAGGAT GGTT CTGC C 2074 

Qy 1321 AAT GCAGGGGCT GAC TAT GAGTTCAC AGAGGGCAC GGT GGT T CT GAAGC CAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I II I I I 
Db 2075 AAT GCAGGGGCT GACT AT GAGTTCACAGAGGGCACGGTGGTT CTGAAGCCAGGAGAGACC 2134 

Qy 1381 CAGAAGGAGTT CT CCGT GGGCATAAT T GAT GACGACATTTTT GAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2135 CAGAAGGAGTT CT CC GT GGGCAT AATT GAT GAC GACATTT TT GAGGAGGAT GAACACTT C 2194 

Qy 1441 T TT GTAAGGTT GAGCAAT GT CC GC AT AGAGGAGGAGCAGC C AGAGGAGGGGAT GCCT C CA 1500 

I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I 
Db 2195 TTT GTAAGGTT GAGCAAT GT CC GC AT AGAGGAGGAGCAGC C AGAGGAGGGGAT GCCTCCA 2254 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2255 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2314 

Qy 1561 GTTACCAT CTT GGATGATGACCATGCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 2315 GTTACCAT CTT GGATGATGACCAT GCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 2374 

Qy 1621 GT C AGT GAGAGT ATT GGT GTTAT GGAGGT CAAGGTT CT GC GGAC ATC AGGT GCCCGGGGT 1680 

I I II I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I II II I II I I I 
Db 2375 GT C AGT GAGAGT ATT GGT GTTAT GGAGGT CAAGGTT CT GC GGACATC AGGT GC CCGGGGT 2434 

Qy 1681 ACAGTCAT CGT CCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2435 AC AGT CAT C GT C C CCT TT AGGACAGT AGAAGGGACAGC CAAGGGT GGCGGT GAGGACTT T 2494 

Qy 1741 GAAGAC AC AT AT G G G GAGT T GGAAT T C AAGAAT GAT GAAAC T GT AT GT G AC AGAC AGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 95 GAAGACACAT AT GGGGAGTT GGAAT T CAAGAAT GAT GAAACT GT ATGT GAC AGAC AGGAA 2554 

Qy .1801 GCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGC AGAGAT GGGAAAGC CAGT ATT GGG 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2555 GCT GACT AT G GAAGAAGAGGAGGC CAAGAGGAT AGCAGAGAT GGGAAAGCC AGT ATT GGG 2614 

Qy 1861 TGA 1863 

I I I 

Db 2615 TGA 2617 
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ORIGIN 



Sequence 1 from Patent WO02059316. 
AX496811 

AX496811.1 GI: 23342335 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Hilbun,E. and Friddle,C.J. 

Human ion exchanger proteins and polynucleotides encoding the same 
Patent: WO 02059316-A 1 01-AUG-2002; 
LEXICON GENETICS INC (US) 

Location/Qualifiers 

1. .2766 

/organism="Homo sapiens" 
/mol_type="unas signed DNA" 
/db xref="taxon:9606" 



Query Match 95.8%; 
Best Local Similarity 98.5%; 
Matches 1813; Conservative 



Score 1784.6; 
Pred. No. 0; 
0; Mismatches 



DB 6; Length 2766; 



24; Indels 



4; Gaps 



l; 



Qy 

Db 



ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I 
ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

121 ACAGGGC AGAACAAT GAGT CCT GT T C AGGGT CATCGGACT GCAAGGAGGGT GTCATC CT G 180 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 180 

181 CCAAT CT GGT AC C C GGAGAAC CCT T CCCTT GGGGACAAGATTGCCAGGGT CATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 C CAAT CT GGT AC CC GGAGAAC C CTT C CCTT GGGGACAAGATTGCCAGGGT CATT GT CT AT 240 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

301 T CT ATTGAAGT CAT C ACCT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC CCAAT GGAGAA 360 

I I I I MM I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mil 
301 T CT AT T GAAGT CAT CACCT CT CAAGAGAGG GAGGT GACAAT TAAGAAAC CCAAT GGAGAA 360 

361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
361 AC C AGC ACAACC ACT ATT C GGGTCT GGAAT GAAACT GT CT CCAAC CT GACCCTTAT GGCC 420 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 



Qy 



481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 



I I I I I I I I I I I I I ! I I I I II I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 

Db 481 ATT GCT GGT GAT CT GGGAC CTT CT AC CAT T GT AGGGAGT GCAGCCTT CAACAT GTTCATC 540 

Qy 541 AT C ATT GGCAT CTGTGT CT AC GTGAT C CCAGAC GGAGAGACT CGCAAGATCAAGC AT CTA 600 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 AT C ATT GGCATCT GT GT CT AC GTGAT CCCAGAC GGAGAGACT C GCAAGAT CAAGCAT CTA 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGT GAC 840 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 781 AT GCACAAAAAGT ACC GC AC AGACAAAC ACCGAGGAATT AT CAT AGAGAC AGAGGGT GAC 840 

Qy 841 CACCCTAAGGGCATT GAGATGGATGGGAAAAT GATGAATT CCCATTTT CTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 CACCCTAAGGGCATT GAGATGGATGGGAAAAT GATGAATT CCCATTTT CTAGATGGGAAC 900 

Qy 901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 CT GGT GCC C CT GGAAGGGAAGGAAGT GGATGAGT CC CGCAGAGAGAT GAT C CGGATT CT C 960 

Qy 961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGTGGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGGAT CT GAAGCAAAAAC ACCCAGAGAAGGACTTAGAT C AGCT GGT GGAGAT GGC CAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

Qy 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGCC 1140 

Qy 1141 T CCAGCAT GAGC GAGGT GCAC ACC GAT GAGC CT GAGGACTT T ATTT C CAAGGT CT T CT TT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 T CCAGCAT GAGC GAGGT GCACACCGAT GAGCCT GAGGACT T T AT TT C CAAGGT CT T CTTT 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 GAC CCAT GT T CTT AC C AGT GC CT GGAGAACT GT GGGGCT GT ACT C CTGACAGT GGT GAGG 1260 

Qy 1261 AAAGGGGGAGACAT GTCAAAGACC AT GT ATGT GGACT ACAAAACAGAGGAT GGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 AAAGGGGGAGACAT GT CAAAGACCATGTATGTGGACT ACAAAACAGAGGAT GGTT CT GCC 1320 

Qy 1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 



Db 



1321 



AAT GC AGGGGCT GACT AT GAGTT CAC AGAGGGC AC GGT GGTT CT GAAGC CAGGAGAGACC 1380 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1381 CAGAAGGAGTT CT C C GT GGGCATAATT GAT GAC GACAT TTT T GAGGAGGAT GAACACTT C 1440 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGAAGGAGTT CT C C GT GGGCATAATT GAT GAC GACAT TTT T GAGGAGGAT GAACACTTC 1440 



1381 



1500 



1441 TTT GTAAGGTT GAGCAAT GT C C GCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT CCA 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 TTT GTAAGGTT GAGCAAT GTC C GCAT AGAGGAGGAGCAGC CAGAGGAGGGGAT GC CT CCA 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

1561 GTT AC CAT CTT GGAT GAT GAC CAT GC AGGCAT CTT C ACTT T T GAAT GTGAT ACTATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 GTT AC CAT CTT GGAT GAT GAC CAT GC AGGCAT CTT CACTT TT GAAT GT GAT ACTATT CAT 1620 

1621 GT C AGT GAGAGTATT GGT GTT AT GGAGGT CAAGGT T CT GC GGACAT C AGGT GCCC GGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 GT C AGT GAGAGTATT GGT GTT AT GGAGGT CAAGGT T CT GC GGACAT C AGGT GCCCGGGGT 1680 

1681 ACAGT C AT CGT C C CCT TT AGGACAGT AGAAGGGACAGC CAAGGGTGGC GGT GAGGACT TT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

1741 GAAGAC ACAT AT GGGGAGTTGGAATT CAAGAAT GAT GAAACT GT AT GT GACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill I I I I 

1741 GAAGAC ACAT AT GGGGAGT TGGAAT T CAAGAAT GAT GAAAC T GT GAAAAC C AT AAG 1796 

1801 GCT GACT ATGGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

1797 GGT T AAAAT AGT AGAT GAGGAGGAAT ACGAAAGGCAAGAGA 1837 
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AX496815 
Sequence 5 
AX496815 
AX496815.1 



3812 bp 
from Patent WO02059316. 

GI: 23342337 



DNA 



linear PAT 26-SEP-2002 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Hilbun,E. and Friddle,C.J. 

Human ion exchanger proteins and polynucleotides encoding the same 
Patent: WO 02059316-A 5 01-AUG-2002; 
LEXICON GENETICS INC (US) 

Location/ Qualifiers 

1. .3812 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon:9606" 



ORIGIN 



Query Match 95.8%; 
Best Local Similarity 98.5%; 
Matches 1813; Conservative 



Score 1784.6; 
Pred. No. 0; 
0; Mismatches 



DB 6; Length 3812; 
24; Indels 4; Gaps 



Qy 



Db 



618 



1; 



ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 677 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 



61 



678 



121 



738 



181 



798 



241 



858 



301 



918 



361 



978 



421 



TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 737 

ACAGGGC AGAACAAT GAGT C CT GTT CAGGGT C ATC GGACT GCAAGGAGGGTGT C AT CCTG 180 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I II II I I I 
ACAGGGC AGAACAAT GAGT C CT GTT CAGGGTCATC GGACT GCAAGGAGGGTGT CAT CCT G 797 

C CAAT CT GGT AC CC GGAGAAC C CT T CCCT T GGGGACAAGAT TGC CAGGGT CAT T GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

C CAAT CT GGT AC C CGGAGAACC CT T CCCT T GGGGACAAGAT T GC CAGGGT CAT T GTCT AT 857 

TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 917 

T CT ATT GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAACC CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAACC CAAT GGAGAA 977 

ACC AGCACAACCACT AT T C GGGT CT GGAAT GAAACT GT CT C CAACCT GAC C CT T AT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACC AGCACAACCACT AT T C GGGT CT GGAAT GAAACT GT CTC CAACCT GAC C CT T AT GGCC 1037 



480 



CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1038 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1097 



481 



540 



ATT GCT GGT GAT CTGGGAC CTT CT ACCAT T GTAGGGAGT GCAGCCTT CAACAT GTT CAT C 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1098 ATT GCT GGT GAT CTGGGAC CTT CT ACCAT T GTAGGGAGT GC AGC CTT CAACAT GTT CAT C 1157 



541 



600 



AT CATT GGC ATCT GT GT CT ACGT GAT C C CAGAC GGAGAGACT CGCAAGAT CAAGCAT CT A 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
1158 AT CATT GGC AT CT GT GT CT AC GT GAT C C CAGACGGAGAGACT CGCAAGAT CAAGCAT CT A 1217 



601 



660 



CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1218 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1277 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1278 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1337 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 
I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1338 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1397 



Qy 781 AT GCACAAAAAGTAC C GCACAGACAAACACC GAGGAATT AT CAT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I |.| I I 

Db 1398 ATGCACAAAAAGTACCGCACAGACAAACACC GAGGAATT AT CAT AGAGACAGAGGGT GAC 1457 

Qy 841 CACCCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT CCCATTTTCT AGAT GGGAAC 900 

I I 1 I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1458 CACC CTAAGGGC ATT GAGAT GGAT GGGAAAAT GAT GAATT CCCATTTTCT AGAT GGGAAC 1517 

Qy 901 CT GGT GCCC CT GGAAGGGAAGGAAGT GGAT GAGT CC CGCAGAGAGAT GATC CGGATT CT C 960 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1518 CT GGT GCCC CT GGAAGGGAAGGAAGT GGAT GAGT C C CGCAGAGAGAT GAT C C GGATTCT C 1577 

Qy 961 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTT AGAT CAGCT GGTGGAGATGGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 

Db 1578 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACT T AGAT CAGCT GGT GGAGATGGC CAAT 1637 

Qy 1021 T ACT AT GCT CT TTC C C ACCAACAGAAGAGC CGC GCCTT CTAC CGT AT CCAAGCCACT CGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1638 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1697 

Qy 1081 AT GAT GACT GGT GCAGGCAAT ATC CT GAAGAAACAT GCAGC AGAACAAGCCAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1698 AT GAT GACT GGT GCAGGCAAT ATC CT GAAGAAACAT GC AGCAGAACAAGCCAAGAAGGC C 1757 

Qy 1141 T CCAGCATGAGCGAGGT GCAC ACC GAT GAGCCT GAGGACT TT AT TT CCAAGGTCTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1758 T CCAGCATGAGC GAGGT GCACACC GAT GAGCCT GAGGACTTTAT TT CCAAGGT CTT CTTT 1817 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1818 GACCCAT GTT CTT AC CAGT GCCT GGAGAACT GTGGGGCT GT ACT CCT GACAGTGGT GAGG 1877 

Qy 1261 AAAGGGGGAGACATGTCAAAGACCATGTATGT GGACTACAAAACAGAGGAT GGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1878 • AAAGGGGGAGACATGTCAAAGACCAT GTATGT GGACTACAAAACAGAGGAT GGTTCTGCC 1937 

Qy 1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1938 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1997 

Qy 1381 C AGAAGGAGTT CT C CGT GGGCATAATT GAT GACGACATTT TT GAGGAGGAT GAACACTT C 1440 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II 

Db 1998 C AGAAGGAGTT CTCC GT GGGCATAATT GAT GAC GACAT TTTT GAGGAGGAT GAACACTT C 2057 

Qy 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I III I I I I I I II I I I I 

Db 2058 TT T GTAAGGT T GAGCAATGT C CGC AT AGAGGAGGAGCAGC CAGAGGAGGGGAT GC CT CCA 2117 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 2118 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2177 

Qy 1561 GTTACCATCTTGGATGATGACCAT GCAGGCATCTTCACTTTTGAAT GTGATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2178 GTT AC CATCTT GGAT GAT GACCAT GCAGGCAT CT T CACTTTT GAAT GT GAT ACT ATT CAT 2237 

Qy 1621 GT CAGT GAGAGT ATT GGTGT T AT GGAGGT CAAGGT T CTGCGGACAT C AGGT GCCCGGGGT 1680 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2238 GT CAGT GAGAGT ATT GGT GTT AT GGAGGT CAAGGTT CT GCGGACATCAGGT GC C CGGGGT 2297 

Qy 1681 ACAGTCAT C GT CC CCT TT AGGACAGT AGAAGGGACAGC CAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I i I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I II I I 
Db 2298 ACAGT CAT C GT CC CCTTT AGGACAGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 2357 

Qy 1741 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT ATGT GACAGACAGGAA 1800 

I I I II I I II I I I I I I I I I I I I I I I I I I I II I I II I II I I I I I I I I I I II I 

Db 2358 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAAC TGTGAAAACCATAAG 2413 

Qy 1801 GCTGACTATGGAAGAAGAGGAGGCCAAGAGGATAGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I II 

Db 2414 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 2454 
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HSNCX22 2534 bp DNA linear PRI 12-NOV-2000 

Homo sapiens partial SCL8A3 gene for solute carrier family 8 
(sodium/ calcium exchanger), member 3 ( SCL8A3 ) , exon 2. 
X93017 

X93017.1 GI:1067133 

SLC8A3 gene; sodium-calcium exchanger. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Kraev,A. , Chumakov, I . and Carafoli / E. 

The organization of the human gene NCX1 encoding the sodium-calcium 
exchanger 

Genomics 37 (1) , 105-112 (1996) 

97079665 

8921376 

2 (bases 1 to 2534) 

Kraev, A. S . 

Direct Submission 

Submitted ( 14-NOV-1995) A.S. Kraev, Swiss Federal Institute of 
Technology, Laboratory of Biochemistry III, Universitaetstr . 16, 
Zurich, CH-8092, SWITZERLAND 
Similar to X91213. 

Location/Qualifiers 

1. .2534 

/organism="Homo sapiens" 
../mol_type="genomic DNA" 
/db_xref="taxon: 9606" 
/ chromosome="14" 
/map="q24.1" 
/cell_line="WI38" 
/cell_type=" fibroblast" 
/tissue_type="lung" 

/clone_lib="Stratagene genomic #946204" 

281. .2126 

/gene="SLC8A3" 

281. .2126 

/gene="SLC8A3" 



/product="solute carrier family 8 (sodium/ calcium 
exchanger) , member 3" 
/number =2 

ORIGIN 

Query Match 95.8%; Score 1784.4; DB 9; Length 2534; 

Best Local Similarity 99.9%; Pred. No. 0>- 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 343 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 402 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 403 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC .462 

Qy 121 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGTC AT CGGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 463 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT CCT G 522 

Qy 181 CCAAT CT GGT ACC C GGAGAACC CTT C CCTT GGGGACAAGATT GCCAGGGTCATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 523 C CAAT CT GGT ACCC GGAGAACC CTT C CCTT GGGGACAAGATT GC CAGGGT CATT GT CT AT 582 

Qy 241 T TT GT GGC C CT GAT AT ACAT GT TCCT T GGGGT GT C CAT C ATT GCT GAC CGCTT CAT GGC A 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 583 T TT GT GGC C CT GAT AT AC AT GT TCCT T GGGGT GT C CAT CATT GCT GAC CGCTT CAT GGC A 642 

Qy 301 T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAAT T AAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 643 TCTATT GAAGT CATCACCTCT CAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 702 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 703 ACCAGCACAAC C AC TAT T CGGGTCT GGAAT GAAACT GT CT C CAAC CT GACC CT TAT GGC C 762 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 763 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 822 

Qy 481 ATT GCT GGT GATCT GGGAC CTT CT AC CATT GT AGGGAGT GCAGCCTT CAAC AT GT TCAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 823 ATT GCT GGT GAT CT GGGAC CT T CT AC CATT GT AGGGAGT GC AGCCT T CAACAT GT T CAT C 882 

Qy 541 ATCATTGGCAT CT GTGT CT AC GT GAT C CCAGAC GGAGAGACT C GCAAGAT CAAGCATCT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 883 AT CATT GGC AT CT GT GT CT AC GT GAT CCCAGAC GGAGAGACT C GCAAGAT CAAGCATCT A 942 

Qy 601 CGAGT CTT CTT CAT CACC GCT GCT T GGAGT AT CTT TGC CT ACAT CT GGCT CT AT AT GAT T 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 943 CGAGT CTT CTT CAT CACC GCT GCT TGGAGTATCTTTGCCTACATCT GGCT CT AT AT GATT 1002 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1003 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1062 



Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1063 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1122 

Qy 781 AT GCACAAAAAGTACC GCAC AGACAAACAC C GAGGAATT ATCATAGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1123 AT GCACAAAAAGTAC C GCACAGACAAACAC CGAGGAATT AT CAT AGAGACAGAGGGTGAC 1182 

Qy 841 CACCCTAAGGGCATTGAGAT GGATGGGAAAAT GAT GAATT CCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1183 CACCCTAAGGGCATT GAGAT GGATGGGAAAAT GAT GAATT CCCATTTTCTAGATGGGAAC 1242 

Qy 901 CT GGT GCCC CT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GAT CC GGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1243 CT GGT GC CC CT GGAAGGGAAGGAAGT GGAT GAGT CCCGC AGAGAGAT GAT C CGGATTCT C 1302 

Qy 961 AAGGAT CT GAAGCAAAAAC ACCCAGAGAAGGACTTAGAT C AGCT GGT GGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1303 AAGGAT CT GAAGCAAAAAC AC C CAGAGAAGGACTTAGAT C AGCT GGT GGAGATGGCCAAT 1362 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I II I I I I I II I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1363 T ACT AT GCT CT T TC C C ACCAACAGAAGAGC C GCGC CTTCT ACCGT AT C CAAGCCACT CGT 1422 

Qy 1081 AT GATGACT GGT GCAGGCAATATCCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1423 AT GAT GACT GGT GCAGGCAATATCCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1482 

Qy 1141 T C CAGC AT GAGC GAGGT GC AC ACC GAT GAGC CT GAGGACT T T AT TT C CAAGGTCTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1483 T C CAGC ATGAGC GAGGT GCAC ACC GAT GAGC CT GAGGACTT TAT TT C CAAGGT CTT CTTT 1542 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1543 GACC C AT GT T CT TAC C AGT GC CTGGAGAACT GT GGGGCT GT ACT CCT GACAGTGGT GAGG 1602 

Qy 1261 AAAGGGGGAGACATGTCAAAGACCATGTATGTGGACTACAAAACAGAGGATGGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1603 AAAGGGGGAGACAT GT CAAAGACC AT GTAT GT GGACT AC AAAACAGAGGAT GGTT CT GCC 1662 

Qy 1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1663 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTT CT GAAGCCAGGAGAGACC 1722 

Qy 1381 C AGAAGGAGTT CT C CGT GGGCATAATT GAT GACGAC ATTTT T GAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1723 CAGAAGGAGTT CTCCGT GGGCATAATTGATGACGACATTTTT GAGGAGGAT GAACACTTC 1782 

Qy 1441 TT T GTAAGGTT GAGCAAT GT CCGC AT AGAGGAGGAGCAGCC AGAGGAGGGGATGCCT CCA 1500 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1783 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1842 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1843 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1902 

Qy 1561 GTTAC CAT CTT GGAT GAT GAC C AT GCAGGCATCT T C ACTTT T GAAT GT GAT ACT AT T CAT 1620 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1903 



1621 



1963 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
GTTACCATCTTGGATGATGACCAT GCAGGCATCTTCACTTTTGAATGT GATACTATTCAT 



1962 



GT C AGTGAGAGT ATT GGT GTT AT GGAGGT CAAGGT T CT GCGGACAT C AGGT GCCC GGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GT CAGTGAGAGT ATT GGT GTT AT GGAGGT CAAGGT T CTGC GGACAT CAGGT GCCCGGGGT 2022 



1681 ACAGT CAT CGT CCC CT TTAGGACAGT AGAAGGGACAGCCAAGGGTGGCGGT GAGGACT T T 1740 

I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
2023 ACAGT CAT CGT CCC CT TTAGGACAGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 2082 

1741 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACTGTAT 1786 

I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I II I II I I I I I I I I 
2083 GAAGACACAT ATGGGGAGTTGGAATT CAAGAATGAT GAAACTGT GT 2128 
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AX299471 
Sequence 1 
AX299471 
AX299471.1 



2781 bp 
from Patent WO0183744. 

GI:17129228 



DNA 



linear 



PAT 26-NOV-2001 



CDS 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Wilm, C. 

Natrium-calcium exchanger protein 
Patent: WO 0183744-A 1 08-NOV-2001; 
MERCK PATENT GmbH (DE) 

Location/Qualifiers 

1. .2781 

/organism="Homo sapiens" 
/mol_type="unas signed DNA" 
/db_xref="taxon:9606" 
1. ,>2781 

/note="unnamed protein product" 
/codon_start=l 
/protein_id="CAD12716. 1" 
/db_xref="GI : 17129229" 

/ trans la tion="MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTIKKPNGETSTTTIRVWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
IAGDLGPSTIVGSAAFNMFIIIGICVYVIPDGETRKIKHLRVFFITAAWSIFAYIWLY 
MILAVFSPGWQVWEGLLTLFFFPVCVLLAWVADKRLLFYKYMHKKYRTDKHRGIIIE 
TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 
LVEMANYYALSHQQKSRAFYRIQATRMMTGAGNILKKHAAEQAKKASSMSEVHTDEPE 
DFISKVFFDPCSYQCLENCGAVLLTWRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 
GTVVLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSNVRIEEEQPEEGMPPAIFNSLPL 
PRAVLASPCVATVTILDDDHAGIFTFECDTIHVSESIGVMEVKVLRTSGARGTVIVPF 
RTVEGTAKGGGEDFEDTYGELEFKNDETVKTIRVKIVDEEEYERQENFFIALGEPKWM 
ERGI SGVRFFKDVTDRKLTMEEEEAKRIAEMGKPVLGEHPKLEVI IEESYEFKTTVDK 
LIKKTNLALWGTHSWRDQFMEAITVSAAGDEDEDESGEERLPSCFDYVMHFLTVFWK 
VLFACVPPTEYCHGWACFAVS I LI I GMLTAI I GDLASHFGCT I GLKDS VTAWFVAFG 
T S VP DT FAS KAAALQ DVYADAS I GNVT G S NAVNVFLG I GLAW S VAAI YWALQGQE FHV 



ORIGIN 



SAGTLAFSVTLFTIFAFVCISVLLYRRRPHLGGELGGPRGCKLATTWLEVSLWLLYIL 
FATLEAYCYIKGF" 



Query Match 95.7%; Score 1783; DB 6; Length 2781; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I II I I I I I 

Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGCAGAACAAT GAGTCCT GTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 121 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GTCAT C CT G 180 

Qy 181 C CAAT CT GGT ACCCGGAGAAC CCTT C CCT T GGGGACAAGAT T GCCAGGGT CATT GT CTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I fl I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 CCAAT CT GGT ACCCGGAGAACCCTT CC CT T GGGGACAAGAT T GCCAGGGT CATT GT CTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CTAT T GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAATTAAGAAAC C CAAT GGAGAA 360 

Qy 361 ACCAGCACAAC CACT AT T C GGGTCT GGAAT GAAACT GT CT C CAAC CT GAC CCTT AT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 ACCAGCACAAC CACT AT T C GGGTCT GGAAT GAAACT GTCT C CAAC CT GAC CCTT AT GGC C 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I II I I I II I I I II I I I I II 

Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 ATT GCT GGT GAT CT GGGACCTT CT AC CAT T GT AGGGAGT GCAGC CT T CAACATGTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 ATT GCT GGT GAT CT GGGACCTT CT AC CATT GT AGGGAGT GCAGCCT T CAACATGTT CAT C 540 

Qy 541 AT CATT GGCAT CTGT GT CT ACGTGAT CCCAGACGGAGAGACT CGCAAGAT CAAGCAT CTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I- 1 I I I I I I I I I I I I I 

Db 541 AT CATTGGCATCTGTGTCTACGTGATCCCAGACGGAGAGACTCGCAAGAT CAAGCAT CTA 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 



Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 li 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 ll 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

781 AT GCACAAAAAGT AC C GCAC AGACAAAC AC C GAGGAATT ATCAT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 AT GCACAAAAAGT ACC GCACAGACAAACAC C GAGGAATT AT CAT AGAGACAGAGGGT GAC 840 

841 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 900 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
841 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 900 

901 CT GGT GC CCCT GGAAGGGAAGGAAGT GGAT GAGT CCCGCAGAGAGAT GATCC GGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CT GGT GCCCCT GGAAGGGAAGGAAGT GGAT GAGT CC CGCAGAGAGAT GAT CC GGATT CT C 960 

961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAAT 1020 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 AAGGAT CT GAAGCAAAAAC AC C CAGAGAAGGACTTAGAT CAGCTGGTGGAGAT GGC CAAT 1020 

1021 TACT AT GCT CTTT C CCACCAACAGAAGAGC C GC GCCTTCT AC CGTATC CAAGCCACT CGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 TACT AT GCT CTTT CCCAC CAACAGAAGAGC CGT GCCTTCT AC C GT AT C CAAGCCACT CGT 1080 

1081 AT GATGACT GGTGCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

II I I I I II I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 AT GATGACT GGTGCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

1141 T C CAGCAT GAGC GAGGT GCAC ACCGAT GAGCCT GAGGACTTT ATTT CCAAGGT CTT CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
1141 T C CAGCAT GAGCGAGGT GC AC AC CGAT GAGCCT GAGGACTTT ATTT CCAAGGT CTT CTTT 1200 

1201 GAC CCAT GT TCTT AC C AGT GC CT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

1201 GAC CC ATGTT CT T AC CAGT GC CT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGT GAGG 1260 

1261 AAAGGGGGAGAC AT GT CAAAGACCAT GT AT GTGGACT ACAAAACAGAGGAT GGTT CT GC C 1320 

I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 AAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GTGGACT ACAAAACAGAGGAT GGTT CT GC C 1320 

1321 AAT GCAGGGGCT GACTATGAGTT CACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

1381 CAGAAGGAGTTCT CCGT GGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 1440 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 CAGAAGGAGTTCT CCGT GGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTT C 1440 

1441 TTT GTAAGGT T GAGCAAT GT C CGCAT AGAGGAGGAGCAGCC AGAGGAG GGGAT GCCT CCA 1500 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 TTT GT AAGGTT GAGCAAT GT C CGCAT AGAGGAGGAGCAGCC AGAGGAGGGGAT GCCTCC A 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

1561 GTT ACCATCTT GGAT GAT GACCAT GCAGGCATCTTCACTTTTGAAT GTGATACTATTCAT 1620 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I. I I I I 



Db 



1561 



GTTACCAT CTT GGAT GAT GAC CAT GCAGGC AT CTT CACT T TTGAAT GT GAT ACT ATT CAT 1620 



Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 



1621 GT CAGT GAGAGT AT T GGT GTT ATGGAGGT CAAGGTT CT GC GGACAT C AGGT GCCCGGGGT 1680 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 GT CAGT GAGAGT ATT GGT GTTAT GGAGGTCAAGGTT CT GC GGACAT CAGGT GCCCGGGGT 1680 

1681 AC AGT C ATCGT CC C CTTT AGGACAGT AGAAGGGACAGCCAAGGGTGGC GGTGAGGACTTT 1740 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 AC AGT C AT CGT CC CCTT T AGGACAGT AGAAGGGACAGC CAAGGGTGGC GGT GAGGACT T T 1740 

1741 GAAGAC ACAT ATGGGGAGTTGGAATT CAAGAAT GAT GAAACTGTAT GT GACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

1741 GAAGAC ACAT ATGGGGAGTTGGAATT CAAGAAT GAT GAAAC TGTGAAAACCATAAG 1796 

1801 GCTGACTATGGAAGAAGAGGAGGCCAAGAGGATAGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 
1797 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 1837 
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Qy 
Db 



1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
10 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 69 



Qy 

Db 

Qy 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
70 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 129 

121 AC AGGGCAGAACAAT GAGT CCT GT T CAGGGTCAT C GGACT GCAAGGAGGGT GTC ATCCT G 180 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

130 AC AGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT C GGACTGCAAGGAGGGT GT CATC CTG 189 



181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I II I I 
190 C CAATCT GGT AC C CGGAGAACC CTT C C CT T GGGGACAAGATT GCCAGGGT CATT GT CT AT 249 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
250 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 309 

301 T CT ATT GAAGTCAT CAC CT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I 
310 T CT ATT GAAGTCAT CAC CT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAA 369 

361 AC C AGCACAACCACTATT CGGGT CT GGAAT GAAACT GT CT C CAAC CT GAC C CTTAT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I 
370 ACCAGC ACAACCACT ATT C GGGT CT GGAAT GAAACT GT CTCCAAC CT GAC CCTTAT GGCC 429 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 489 

481 ATTGCTGGT GAT CTGGGACCTT CT ACCATT GTAGGGAGT GCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

490 AT T GCT GGT GAT CTGGGAC CTT CT ACCATT GTAGGGAGT GCAGCCTT CAACAT GTT CAT C 549 

541 AT CATTGGCATCTGTGTCTACGTGATCCCAGACGGAGAGACTCGCAAGAT CAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
550 ATCATT GGC ATCT GT GTCT ACGT GAT CCCAGAC GGAGAGACT CGCAAGAT CAAGCAT CT A 609 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
610 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 669 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 729 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 789 

781 AT GCACAAAAAGT ACC GCACAGACAAAC ACCGAGGAATT AT CATAGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
790 AT GCACAAAAAGTAC C GCACAGACAAAC ACC GAGGAATT AT CATAGAGACAGAGGGT GAC 849 

841 C ACCCT AAGG GCATT GAGAT GGAT GGGAAAAT GAT GAATT C C C ATTTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
850 C ACCCT AAGGGCATT GAGAT GGATGGGAAAATGATGAATTCCCATTTT CT AGATGGGAAC 909 

901 CT GGT GCCCCT GGAAGGGAAGGAAGTGGAT GAGT CC CGCAGAGAGAT GAT CCGGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I II I II I I I II I I I I I I I I I I II I I I I I I I I I I I III 
910 CT GGTGC CCCTGGAAGGGAAGGAAGT GGAT GAGT C C CGCAGAGAGAT GAT C CGGAT CCT C 969 

961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCC^lAT 1020 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I II I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 
Db 



970 AAGGAT CTGAAGCAAAAACACC C AGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC CAAT 1029 

1021 T ACT AT GCT CTTT CC C ACCAACAGAAGAGCC GCGCCTT CTACCGTAT CCAAGC CACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I 
1030 TACT AT GCT CTT TCC C ACCAACAGAAGAGC C GCGCCTT CT ACCGTATCCAAGCCACT C GT 1089 

1081 AT GATGACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGC C 1140 

II II I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT GATGACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 



1090 



1149 



1141 T C C AGCAT GAGC GAGGT GCACACCGAT GAGC CT GAGGACTTT ATT T CCAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1150 T CCAGC AT GAGC GAGGT GCACACCGAT GAGC CT GAGGACTT TAT TT CCAAGGT CTT CTTT 1209 

1201 GAC C CAT GTT CT T ACCAGT GC CT GGAGAACT GT GGGGCT GT ACT CCT GAC AGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1210 GACC C AT GTT CTT AC CAGTGCCT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGT GAGG 1269 

1261 AAAGGGGGAGAC AT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGT T CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1270 AAAGGGGGAGACAT GT CAAAGAC CATGT AT GT GGACT ACAAAACAGAGGAT GGT TCT GCC 



1329 



1321 



AATGCAGGGGCTGACTAT GAGTTCACAGAGGGCACGGTGGTT CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1330 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCAC GGT GGTT CT GAAGCCAGGAGAGACC 1389 

1381 C AGAAGGAGT T CT CC GT GGGC ATAAT T GAT GACGACATTTTT GAGGAGGAT GAACACT T C 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1390 CAGAAGGAGT T CT CC GT GGGCATAAT T GAT GACGAC ATTT T T GAGGAGGAT GAACACTT C 1449 

1441 TTT GT AAGGTTGAGCAAT GT CC GC AT AGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT CCA 1500 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I 
1450 TTT GT AAGGTTGAGCAAT GTCC GCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT C CA 1509 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1569 

1561 GTTACC AT CTT GGAT GAT GAC CAT GCAGGC AT CT T CACTTTT GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1570 GT T ACC AT CTTGGAT GAT GAC CAT GC AGGCAT CT T CACTTTT GAAT GT GAT ACT ATT CAT 



1621 



1629 



GTCAGTGAGAGTATT GGTGTTATGGAGGTCAAGGTT CTGCGGACATCAGGTGCCCGGGGT 1680 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1630 GT C AGT GAGAGT ATT GGT GTT AT GGAGGT CAAGGTT CT GCGGAC AT CAGGT GCC C GGGGT 1689 



1681 ACAGT CATCGTC CC CT TT AGGACAGT AGAAGGGAC AGC CAAGGGT GGC GGT GAGGACT T T 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1690 ACAGT CAT C GTC CCCTTT AGGACAGT AGAAGGGAC AGC CAAGGGT GGC GGT GAGGACTT T 1749 

1741 G AAG ACAC AT AT G GGGAGT T G GAAT T C AAG AAT GAT GAAACT GTAT GT GAC AG AC AG GAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

1750 GAAGACACAT AT GGGGAGTTGGAATT CAAGAAT GAT GAAAC T GT GAAAAC CAT AAG 1805 

1801 GCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I II 

1806 GGT TAAAAT AGT AGAT GAGGAGGAAT ACGAAAGGCAAGAGA 1846 



RESULT 8 
HSA304853 

LOCUS HSA304853 2837 bp mRNA linear PRI 06-JUN-2001 

DEFINITION Homo sapiens mRNA for sodium/ calcium exchanger , SCL8A3, alternative 

splice form B (SCL8A3 gene) . 
ACCESSION AJ304853 

VERSION AJ304853.1 GI: 14330384 

KEYWORDS alternative splicing; form B; SCL8A3 gene; SCL8A3 protein; 

Sodium/calcium exchanger. 
SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
REFERENCE 1 

AUTHORS Gabellini , N . 

TITLE Characterization of the human SCL8A3 gene for solute carrier family 

8, member 3 ( sodium/ calcium exchanger) 
JOURNAL Unpublished 
REFERENCE 2 (bases 1 to 2837) 
AUTHORS Bortoluzzi , S . 
TITLE Direct Submission 

JOURNAL Submitted (22-DEC-2000) Bortoluzzi S., Department of Biology and 
Department of Biological Chemistry, University of Padova, via G. 
Colombo 3, 35131 PADOVA, ITALY 
FEATURES Location/Qualifiers 
source 1. .2837 

/organism="Homo sapiens" 
/mol_type= M mRNA" 
/db_xref="taxon: 9606" 
/ chromosome="14" 
/map="14q24.1" 
gene 1. .2837 

/gene="SCL8A3" 
CDS 63. .2837 

/gene="SCL8A3" 

/function=" sodium/ calcium exchanger" 

/note="alternative splice form B (exons 2, 4, 5, 9, 10,. 

11, 12)" 

/codon_start=l 

/product="sodium/calcium exchanger SCL8A3" 
/protein_id="CAC4 0985.1" 
/db_xref ="GI : 14330385" 
/db_xref="GOA:Q96QGl" 
/db_xref ="TrEMBL:Q96QGl" 

/ trans la tion="MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTIKKPNGETSTTTIRVWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 

i agdlgp st i vgsaafnmfi 1 1 gi cvyvi pdgetrki khlrvffitaaws i fayi wl y 
mi lavfs p gwqvwegl lt l f ff p vcvl lawvadkrl l fyk ymh kk yrtdkhrg i he 
tegdhpkgiemdgkmmnshfldgnlvplegkevdesrremi rilkdlkqkhpekdldq 
lv™anyyalshqqksrafyriqatrmmtgagnilkkhaaeqakkas 

DFISKVFFDPCSYQCLENCGAVXLTWRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 
GTVVLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSNVRIEEEQPEEGMPPAIFNSLPL 
P RAVLAS P CVATVT I LDDDHAGI FT FECDT I HVS ES I GVMEVKVLRT S GARGTVI VP F 
RTV^GTAKGGGEDFEDTYGELEFKNDETVlCriRVKIVDEEEYERQENFFIALGEPKWM 



ERGISALLLSPDRKLTMEEEEAKRIAEMGKPVLGEHPKLEVIIEESYEFKTTVDKLIK 
KTNLALVVGTHSWRDQFMEAIWSAAGDED^ 

ACVP PT E YCHGWAC FAVS I L 1 1 GMLT AI I GDLAS H FGCT I GLKD S VTAWFVAFGT S V 
P DT FAS KAAALQ DVYADAS I GNVTGSNAVNVFLGI GLAWS VAAI YWALQGQE FHVS AG 
TLAFSWLFTIFAFVCISVLLYRRRPHLGGELGGPRGCKLATTWLFVSLWLLYILFAT 
LEAYCYIKGF" 

ORIGIN 

Query Match 95.7%; Score 1783; DB 9; Length 2837; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 63 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 122 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 123 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 182 

Qy 121 ACAGGGCAGAACAATGAGT CCT GTT C AGGGTCAT C GGACTGCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 183 ACAGGGCAGAACAATGAGT CCT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 242 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 243 C CAAT CTGGT AC CCGGAGAAC C CTT C C CTT GGGGACAAGAT T GCC AGGGT CATTGT CT AT 302 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 303 TTT GT GGC C CT GAT AT ACAT GT TC CTT GGGGT GT C CAT CATT GCT GAC CGCTT CAT GGCA 362 

Qy 301 T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATT AAGAAACC CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 363 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT T AAGAAACC CAAT GGAGAA 422 

Qy 361 ACC AGCACAAC CAC TAT T C GGGT CT GGAAT GAAACT GT CT C CAAC CT GAC CCTT AT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 423 ACC AGCACAAC CAC TAT T C GGGT CT GGAAT GAAACT GT CT CCAAC CT GAC CCTT AT GGCC 482 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 83 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 542 

Qy 481 ATT GCT GGT GAT CT GGGACCT T CT ACCATT GT AGGGAGT GCAGCCT T CAACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 543 ATT GCT GGT GAT CT GGGAC CTT CT AC CAT T GT AGGGAGT GCAGCCT T CAACAT GTT CAT C 602 

Qy 541 ATCATT GGCATCT GTGTCT ACGTGATCCCAGACGGAGAGACTCGCAAGAT CAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 603 AT CAT T GGCAT CT GTGT CT ACGTGAT CCCAGAC GGAGAGACT C GCAAGAT CAAGCATCTA 662 

Qy 601 C GAGT CTT CTT CAT CAC C GCT GCT T GGAGT AT CT TTGCCT ACATCT GGCT CT AT AT GATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 663 C GAGT CTT CTT CAT CAC C GCT GCT T GGAGT AT CT TT GC CT ACATCT GGCT CT AT AT GATT 722 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 



1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 723 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 782 

Qy 721 TTT C CAGTGT GT GT CCTT CT GGC CT GGGT GGCAGATAAACGACT GCT CTT CT ACAAAT AC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 783 T TT C CAGTGT GT GT CCTT CT GGC CT GGGT GGCAGATAAACGACT GCT CTT CTACAAAT AC 842 

Qy 781 AT GCACAAAAAGT ACCGCAC AGACAAACAC CGAGGAATT AT CAT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 843 AT GCACAAAAAGT ACCGCAC AGACAAACAC C GAGGAATTAT CAT AGAGACAGAGGGT GAC 902 

Qy 841 CAC C CTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT C C C ATTTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 903 CACC CTAAGGGCATT GAGAT GGATGGGAAAAT GAT GAATTC CCATTTT CT AGAT GGGAAC 962 

Qy 901 CT GGTGCCC CTGGAAGGGAAGGAAGT GGAT GAGT C CCGCAGAGAGAT GAT CC GGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I 
Db 963 CT GGTGCCC CTGGAAGGGAAGGAAGT GGAT GAGT C CCGCAGAGAGAT GAT C CGGATT CT C 1022 

Qy 961 AAGGAT CTGAAGCAAAAACAC C CAGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGC CAAT 1020 

1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1023 AAGGAT CTGAAGCAAAAACAC C C AGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC CAAT 1082 

Qy 1021 TACT AT GCT CTTT CC C ACCAACAGAAGAGCC GCGC CTT CT ACCGTAT CCAAGC CACT CGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1083 TACT AT GCT CTTT CC C ACCAACAGAAGAGCC GT GC CTT CT ACCGTAT CCAAGC CACT CGT 1142 

Qy 1081 AT GAT GACT GGT GCAGGCAATAT CCT GAAGAAAC AT GCAGCAGAACAAGC CAAGAAGGC C 1140 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1143 AT GAT GACT GGT GCAGGCAATAT CCT GAAGAAAC AT GCAGCAGAACAAGC CAAGAAGGC C 1202 

Qy 1141 T CCAGCAT GAGCGAGGTGCAC ACCGAT GAGC CT GAGGACTTT ATT T C CAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1203 TCCAGCATGAGCGAGGTGCACACCGAT GAGCCTGAGGACTTTATTTCCAAGGT CTT CTTT 1262 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1263 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1322 

Qy 1261 AAAGGGGGAGACATGTCAAAGACCATGTATGT GGACTACAAAACAGAGGAT GGTTCTGCC 1320 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1323 AAAGGGGGAGACATGTCAAAGACCATGTAT GT GGACTACAAAACAGAGGAT GGTTCTGCC 1382 

Qy 1321 AAT GCAGGGGCT GACT AT GAGTT CAC AGAGGGC ACGGT GGT T CT GAAGCC AGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

Db 1383 AAT GCAGGGGCT GACT AT GAGTT C ACAGAGGGCACGGT GGT T CT GAAGCCAGGAGAGACC 1442 

Qy 1381 C AGAAGGAGTT CT CC GT GGGCAT AATT GAT GAC GAC AT TTT T GAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1443 C AGAAGGAGT TCT C C GTGGGCAT AAT T GAT GACGACATTTT T GAGGAGGAT GAACACTT C 1502 

Qy 1441 TTT GTAAGGTTGAGCAAT GT C C GCAT AGAGGAGGAGCAGCC AGAGGAGGGGATGCCT C CA 1500 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1503 TTT GTAAGGTTGAGCAAT GT CCG CAT AGAGGAGGAGC AGCCAGAGGAGGGGAT GC CT C CA 1562 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | I I I I I | I I I I I I I I I I I I I I I I I I I I I I 



Db 



1563 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1622 



Qy 1561 GTT ACC AT CTT GGAT GAT GAC CAT GC AGGCAT CT T CACTTTT GAATGT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I 1 I I I I I I I I I I I I I I II I I I I I I I I I I I ! I I 1 I I I I I I I I I I I I I I I I 
Db 1623 GT T ACC ATCTT GGAT GAT GAC C AT GCAGGCAT CTT CACTTTTGAAT GTGAT ACT ATT CAT 1682 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1683 GT CAGT GAGAGT ATT GGTGTT ATGGAGGT CAAGGT T CTGCGGACAT CAGGT GCC CGGGGT 1742 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1743 ACAGT C ATCGT C CC CTTTAGGACAGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 1802 

Qy 1741 GAAGAC AC AT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT AT GTGAC AGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1803 GAAGAC ACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAAC TGTGAAAACCATAAG 1858 

Qy 1801 GCTGACTATGGAAGAAGAGGAGGCCAAGAGGATAGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

Db 1859 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 1899 



RESULT 9 
AX480881 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

FEATURES 

source 



ORIGIN 



AX480881 2966 bp DNA linear PAT 12-AUG-2002 

Sequence 41 from Patent WO0246415. 

AX480881 

AX480881.1 GI: 22217538 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Lee,E.A., Baughn,M.R., Yue,H., Ding,L., Raumann, B . E. , Haf alia, A. J. , 
Khan, F. A., Nguyen, D.B., Elliott, V. S . , Ramkumar,J., Walia,N.K., 
Ison,C.H., Lu,Y., Gandhi,A.R., Warren, B. A., Duggan,B.M., 
Tribouley,C.M. , Burford,N., Lu,D.A., Lal,P.G., Yao,M. G. , Xu,Y., 
Bruns,C.M., Thangavelu, K. , Swarnakar,A. , Tang,Y.T., Azimzai,Y., 
Thornton, M. , Arvizu,C. and Policky,J.L. 
Transporters and ion channels 
Patent: WO 0246415-A 41 13-JUN-2002; 
Incyte Genomics, Inc. (US) 

Location/ Qualifiers 

1. .2966 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db_xref="taxon: 9606" 
/note="Incyte ID No: 5923789CB1" 



Query Match 95.7%; Score 1783; DB 6; Length 2966; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 



l; 



Qy 



1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 201 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 260 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I 
Db 261 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 320 

Qy 121 ACAGGGC AGAACAAT GAGT CCT GTT CAGGGTC AT C GGACT GCAAGGAGGGTGTCATC CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 321 ACAGGGC AGAACAAT GAGT CCT GT T C AGGGT CATC GGACT GCAAGGAGGGT GTCATC CTG 380 

Qy 181 CCAAT CT GGT AC C C GGAGAAC CCT T CC CTT GGGGACAAGAT TGCCAGGGT CATT GTCT AT 240 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I 

Db 381 CCAAT CT G GTACC C GGAGAAC C CTT C C CTT GGGGACAAGATTGCCAGGGT CATT GTCT AT 440 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 441 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 500 

Qy 301 T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 360 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 501 T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 560 

Qy 361 ACCAGCACAACCACTATTCGGGTCT GGAAT GAAACTGT CTCCAACCT GACCCTTATGGCC 420 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 561 ACCAGC ACAAC CACT ATT CGGGT CT GGAAT GAAACT GT CT C CAACCT GAC CCTT AT GGCC 620 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 621 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 680 

Qy 4 81 ATT GCT GGT GAT CT GGGACCTT CT ACCATT GT AGGGAGT GCAGC CTT CAACAT GTT CATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 681 AT T GCT GGT GAT CT GGGACCTT CT AC CAT T GT AGGGAGT GCAGC CT T CAACAT GTTCATC 740 

Qy 541 AT CATT GGCATCTGTGTCTACGTGATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 741 AT CATT GGCAT CT GT GTCT AC GT GAT C C CAGAC GGAGAGACTCGCAAGAT CAAGC AT CTA 800 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 801 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 860 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCT CCT CACT CTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 861 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 920 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 921 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 980 

Qy 781 AT GCACAAAAAGT AC C GCAC AGACAAACAC CGAGGAAT TAT CAT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 981 AT GCACAAAAAGT AC CGCACAGACAAAC AC CGAGGAATT AT CAT AGAGACAGAGGGT GAC 1040 

Qy 841 CACC CT AAGGGC AT T GAGAT GGAT GGGAAAAT GAT GAATT CCCATTTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1041 CACC CTAAGGGCAT TGAGAT GGAT GGGAAAAT GAT GAATT CCCATTTT CT AGAT GGGAAC 1100 



901 



960 



CTGGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGT CCCGC AGAGAGAT GAT CCGGATTCT C 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1101 CTGGT GCCC CT GGAAGGGAAGGAAGT GGAT GAGT C CC GC AGAGAGAT GAT C CGGATTCTC 1160 

961 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGT GGAGATGGCCAAT 1020 
I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1161 AAGGAT CT GAAGCAAAAACACC C AGAGAAGGACTT AGAT C AGCTGGT GGAGAT GGCCAAT 1220 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1221 TACT AT GCT CTT T CCCACCAACAGAAGAGCCGT GCCTT CTACCGT AT CCAAGC CACT CGT 1280 

1081 ATGAT GACTGGT GCAGGCAATATCCT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1281 ATGAT GACT GGT GCAGGCAATATCCT GAAGAAACATGC AGCAGAACAAGCCAAGAAGGC C 1340 

1141 T CCAGCAT GAGC GAGGT GCACACCGAT GAGCCT GAGGACT TT ATT T C CAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1341 T CCAGCAT GAGC GAGGTGCACACCGAT GAGCCT GAGGACTTT ATTT CCAAGGT CTT CTTT 1400 

1201 GAC CCATGTTCTT ACCAGT GCCT GGAGAACT GT GGGGCT GT ACTC CT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1401 GAC CCAT GT TCT T ACCAGT GCCT GGAGAACTGT GGGGCT GT ACT C CT GACAGT GGT GAGG 1460 

1261 AAAGGGGGAGAC AT GT CAAAGACCAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CTGCC 1320 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1461 AAAGGGGGAGACATGT CAAAGAC CAT GTATGT GGACT ACAAAACAGAGGAT GGTT CTGCC 1520 

1321 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGT GGTT CTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1521 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGT GGTT CTGAAGCCAGGAGAGACC 1580 

1381 CAGAAGGAGTT CTCCGTGGGCATAATTGAT GACGACATTTTTGAGGAGGATGAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1581 CAGAAGGAGTT CT C CGT GGGC ATAAT T GAT GACGACATTT T T GAGGAGGAT GAACACTT C 1640 

1441 T TT GT AAGGTT GAGCAAT GT C C GC AT AGAGGAGGAGC AGCC AGAGGAGGGGAT GC CTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1641 T TT GTAAGGTT GAGCAAT GT CCGC AT AGAGGAGGAGC AGC C AGAGGAGGGGAT GC CT CCA 1700 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1701 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1760 

1561 GTTACCAT CTTGGATGAT GACCATGCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1761 GTT AC CAT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACT TTT GAAT GT GAT ACT AT TCAT 1820 

1621 GTC AGT GAGAGT AT TGGT GTT ATGGAGGT CAAGGTT CT GCGGACAT C AGGT GCCC GGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1821 GTCAGT GAGAGT ATT GGT GT T ATGGAGGT CAAGGT T CT GCGGACAT C AGGT GC C CGGGGT 1880 

1681 ACAGT CAT C GT C C C CTT T AGGACAGT AGAAGGGAC AGC CAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1881 ACAGT CAT C GT C C CCTT TAGGACAGTAGAAGGGACAGC CAAGGGT GGCGGT GAGGACTTT 1940 



Qy 1741 GAAGAC ACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GTAT GT GAC AGACAGGAA 1800 

I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I 

Db 1941 GAAGACACATAT GGGGAGTT GGAATT CAAGAAT GAT GAAAC T GT GAAAACCATAAG 1996 



Qy 1801 GCT GACTAT GGAAGAAGAGGAGGCCAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

Db 1997 GGT TAAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGA 2037 
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Gabellini, N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli,E. 
Direct Submission 
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Location/Qualifiers 

1. .5250 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref= M taxon: 9606" 
/ chromosome="14" 
/map="14q24.2" 
1. .5250 
/gene="SLC8A3" 
1. .754 

/gene="SLC8A3" 
755. .3520 
/gene="SLC8A3 " 

/note="NCX3.2; expressed in brain and skeletal muscle; 

alternatively spliced" 

/codon_start=l 

/product="Na+/Ca2+ exchanger isoform 3 splice variant 2" 
/protein_id="AAN60790. 1" 
/db_xref="GI: 24421221" 

/translation="MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTIKKPNGETSTTTIRWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
IAGDLGPSTI VGSAAFNMFI 1 1 GICVYVT PDGETRKI KHLRVFFITAAWSI FAYIWLY 



MI LAVFS PGWQVWEGLLTLFFFPVCVLLAWVADKRLLFYKYMHKKYRTDKHRGI HE 
TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 
LVEMANYYALSHQQKSRAFYRIQATRMMTGAGNILKKHAAEQAKKAS SMSEVHTDEPE 
DFISKVFFDPCSYQCLENCGAVLLTWRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 
GTVVLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSNVRIEEEQPEEGMPPAIFNSLPL . 
P RAVLAS P C VATVT I L D D DHAG I FT FECDT I HVS ESI GVMEVKVL RT S GARGT VI VP F 
RTVEGTAKGGGEDFEDTYGELEFKNDETVKTIRVKIVDEEEYERQENFFIALGEPKWM 
ERGISDVTDRKLTMEEEEAKRIAEMGKPVLGEHPKLEVIIEESYEFKTTVDKLIKKTN 
LALWGTHSWRDQFMEAIWSAAGDEDEDESGEERLPSCFDYVMHFLTVFWKVLFACV 
P PT E YCHGWAC FAVS I L 1 1 GMLTAI I GDLASH FGCT I GLKDS VTAWFVAFGT S VPDT 
FAS KAAALQ D VYADAS I GNVTGSNAVNVFLGI GLAWSVAAI YWALQGQEFHVS AGT LA 
FSVTLFTI FAFVCI SVLLYRRRPHLGGELGGPRGCKLATTWLFVSLWLLYI LFATLE1A 
YCYIKGF" 

3'UTR 3521. .5250 

/gene="SLC8A3" 

polyAjsignal 5221. .5226 

/gene="SLC8A3" 

ORIGIN 

Query Match 95.7%; Score 1783; DB 9; Length 5250; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 755 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 814 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 815 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 874 

Qy 121 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 180 

II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 875 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 934 

Qy 181 CCAAT CT GGT ACCC GGAGAAC CCT T CCCTT GGGGACAAGATTGC CAGGGT CATT GTCT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 935 CCAAT CT GGT AC CC GGAGAAC CCT T CCCTT GGGGACAAGATT GC CAGGGT CATT GTCT AT 994 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 995 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 1054 

Qy 301 T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC CCAATGGAGAA 360 

I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I 
Db 1055 T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAAT TAAGAAACCCAATGGAGAA 1114 

Qy 361 AC C AGC ACAAC CACT ATT CGGGT CT GGAAT GAAACT GT CT C CAACCT GACCCTTAT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1115 ACCAGCACAAC CACT ATT C GGGTCT GGAAT GAAACT GT CT CCAACCT GAC C CTT ATGGCC 1174 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1175 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1234 



Qy 



481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 
I I II I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I II I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



1235 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 1294 



541 



600 



AT CATT GGCAT CTGT GT CT ACGTGAT CCC AGACGGAGAGACT CGCAAGAT CAAGCAT CT A 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
1295 AT CATT GGC ATCT GT GT CT ACGTGAT C CC AGACGGAGAGACT CGCAAGAT CAAGCAT CT A 1354 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1355 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1414 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1415 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTT GGGAAGGCCTCCTCACTCTCTTCTTC 1474 



721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1475 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 



781 



1535 



841 



1595 



901 



1655 



961 



AT GCACAAAAAGT AC CGCACAGACAAACAC CGAGGAAT TAT CAT AGAGACAGAGGGT GAC 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT GCACAAAAAGTAC CGCACAGACAAACAC CGAGGAATT AT CAT AGAGACAGAGGGT GAC 

CACC CTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT C CCATTT TCT AGAT GGGAAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CACCCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT CCCATTTTCT AGAT GGGAAC 



780 



1534 



840 



1594 



900 



1654 



CT GGT GCCC CTGGAAGGGAAGGAAGT GGAT GAGT CCC GC AGAGAGAT GATC C GGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I II I I I I I I 

CT GGT GC CC CT GGAAGGGAAGGAAGT GGAT GAGT CCC GC AGAGAGAT GATC C GGATT CT C 1714 



AAGGAT CT GAAGCAAAAAC AC C CAGAGAAGGACTT AGAT C AGCT GGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1715 AAGGAT CT GAAGCAAAAAC AC CCAGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC CAAT 1774 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
1775 T ACT AT GCT CTT T C C CACCAACAGAAGAGC CGT GCCTTCT AC CGT AT C CAAGCC ACT CGT 1834 

1081 AT GAT GACTGGTGCAGGCAATATCCT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I 
1835 AT GAT GACTGGT GCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1894 

1141 T C CAGCATGAGC GAGGT GCACACC GAT GAGCCT GAGGACTTT ATTT C CAAGGT CTT CTT T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1895 T C CAGCATGAGC GAGGT GCACACC GAT GAGCCTGAGGACTT T ATTT C CAAGGTCTT CTT T 1954 

1201 GACC CAT GTT CTTACC AGT GCCTGGAGAACT GT GGGGCT GT ACT C CT GACAGT GGT GAGG 1260 
I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACC CAT GTT CTTACC AGT GCCTGGAGAACT GT GGGGCT GTACTCCT GACAGT GGT GAGG 2014 



1955 



1320 



1261 AAAGGGGGAGACAT GT CAAAGACCAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GC C 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2015 AAAGGGGGAGACAT GT CAAAGACCAT GTAT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 2074 

1321 AATGC AGGGGCT GACT ATGAGTTCACAGAGGGCAC GGTGGT T CT GAAGCCAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2075 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 2134 



Qy 
Db 



1381 
2135 



CAGAAGGAGTT CT CCGT GGGCATAATT GAT GAC GAC AT TTTT GAGGAGGAT GAACACTT C 1440 
I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
CAGAAGGAGTT CT C CGT GGGCATAATT GAT GAC GACAT TTTT GAGGAGGAT GAACACTTC 2194 



Qy 1441 T TT GT AAGGTT GAGCAAT GTCCGCATAGAGGAGGAGCAGC CAGAGGAGGGGAT GCCTC CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2195 TTTGT AAGGTT GAGCAAT GT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 2254 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2255 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2314 

Qy 1561 GTT AC CAT CTT GGAT GAT GAC CAT GCAGGC AT CTT CACT TTT GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I 

Db 2315 GTT AC CAT CTT GGAT GAT GAC CAT GCAGGC AT CTT CACT TTT GAAT GT GAT ACT ATTCAT 2374 

Qy 1621 GT C AGT GAGAGT ATT GGTGTT ATGGAGGT CAAGGTTCT GC GGACAT CAGGT GC C CGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2375 GTCAGT GAGAGT ATTGGT GTT AT GGAGGT CAAGGTTCT GC GGACAT CAGGT GC CCGGGGT 2434 

Qy 1681 ACAGTCAT CGT CCC CTTT AGGACAGTAGAAGGGACAGC CAAGGGT GGC GGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2435 AC AGT CAT CGT C CC CT T T AGGACAGT AGAAGGGAC AGCC AAGGGT GGC GGT GAGGACT TT 2494 

Qy 1741 GAAGAC ACATAT GGGGAGTT GGAAT T CAAGAAT GATGAAACT GT AT GT GACAGACAGGAA 1800 

I I I I I II I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I II I 

Db 2495 GAAGAC ACATAT GGGGAGTT GGAATT CAAGAAT GATGAAAC T GT GAAAAC C AT AAG 2550 

Qy 1801 GCT GACT AT GGAAGAAGAGGAGGCCAAGAGGAT AGCAGAGA 1841 

I I I I I I I I I I I I I I I I I I I I I I I 

Db 2551 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 2591 
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AF510502 5268 bp mRNA linear PRI 30-OCT-2002 

Homo sapiens Na+/Ca2+ exchanger isoform 3 splice variant 3 (SLC8A3) 
mRNA, complete cds; alternatively spliced. 
AF510502 

AF510502.1 GI: 24421222 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo... 

1 (bases 1 to 5268) 

Gabellini / N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli,E. 

The human SLC8A3 gene and the tissue-specific Na(+)/Ca(2+) 

exchanger 3 isoforms 

Gene 298 (1), 1-7 (2002) 

22294016 

12406570 

2 (bases 1 to 5268) 

Gabellini, N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli,E. 
Direct Submission 

Submitted ( 09-MAY-2002 ) Department of Biology, Unv. of Padova, via 



FEATURES 

source 



gene 



5'UTR 



CDS 



3 1 UTR 



polyA_signal 



G. Colombo, Padova, PD 35131, Italy 
Location/Qualifiers 
1. .5268 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon:9606" 

/ ch r omo s ome= " 1 4 " 

/map="14q24,2" 

1. .5268 

/gene="SLC8A3" 

1. .754 

/gene="SLC8A3" 
755. .3538 
/gene="SLC8A3" 

/note="NCX3 . 3; expressed in skeletal muscle; alternatively 

spliced" 

/codon_start=l 

/product="Na+/Ca2+ exchanger isoform 3 splice variant 3" 

/protein_id="AAN60791. 1" 

/db_xref="GI:24421223" 

/translation="MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTI KKPNGETSTTTI RVWNETVSNLTLMALGS SAPEILLSLI EVCGHGF 
I AGDLGPSTI VGSAAFNMFI I IGI CVYVI PDGETRKI KHLRVFFITAAWS I FAYIWLY 
MIIAVFSPGWQWEGLLTLFFFPVCVXLAWVADKRLLFYKYMHKKYRTDKHRGIIIE 
TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMI RILKDLKQKHPEKDLDQ 
LVEMAN YYAL S HQQ K S RAF YRI QAT RMMT GAGN I LKKHAAEQAKKAS SMS EVHT D E P E 
DFISKVFFDPCSYQCLENCGAVLLTVVRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 
GTvVLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSNVRIEEEQPEEGMPPAIFNSLPL 
P RAVLAS P CVATVT I L D D DHAG I FT FEC DT I HVS ESI GVMEVKVLRT S GARGTVT VP F 
RTV^GTAKGGGEDFEDTYGELEFKNDETV1<TIRVKIVDEEEYERQENFFIALGEPKWM 
ERGISALLLSPDWDRKLTMEEEEAKRIAEMGKPVXGEHPKLEVTIEESYEFKTTVDK 
LIKKTNLALVVGTHSWRDQFMEA1TVSAAGDEDEDESGEERLPSCFDYWIHFLTVFWK 
VLFACVPPTEYCHGWACFAVSILIIGMLTAIIGDLASHFGCTIGLKDSVTAWFVAFG 
T S VP DT FAS KAAALQ DVYADAS I GNVT G S N AVNVFL G I GLAWS VAAI YWALQ GQ E FHV 
SAGTLAFSVTLFTIFAFVCISVLLYRRRPHLGGELGGPRGCKLATTWLFVSLWLLYIL 
FATLEAYCYIKGF" 
3539. .5268 
/gene="SLC8A3" 
5239. .5244 
/gene="SLC8A3" 



ORIGIN 



Query Match 95.7%; Score 1783; DB 9; Length 5268; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative. 0; Mismatches 25; Indels 4; Gaps 



1;... 



Qy 

Db 



1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
755 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 814 



Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
815 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 874 



Qy 



121 ACAGGGCAGAACAAT GAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGT GTCATCCT G 180 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 



Db 875 AC AGGGCAGAACAAT GAGT C CT GTT CAGGGT CATC GGACTGCAAGGAGGGTGT CAT CCT G 934 

Qy 181 C CAAT CT GGT ACC CGGAGAAC C CTT C CCTT GGGGACAAGAT T GCC AGGGT CATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 935 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 994 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 995 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 1054 

Qy 301 T CT ATT GAAGTC ATCACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1055 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 1114 

Qy 361 ACC AGCACAACCACT ATT C GGGT CT GGAAT GAAACT GT CT CCAACCT GAC C CTTAT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1115 ACC AGCACAACCACT ATT C GGGT CT GGAAT GAAACT GT CT CCAACCT GAC CCTT AT GGC C 1174 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1175 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1234 

Qy 481 ATT GCT GGT GAT CT GGGACCTT CT ACCATT GT AGGGAGT GC AGCCTT CAAC AT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1235 ATT GCT GGT GAT CTGGGACCTT CT AC CATT GT AGGGAGT GCAGCCTT CAAC AT GTT CAT C 1294 

Qy 541 ATCATTGGCATCTGT GTCTACGT GATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 600 

I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1295 ATCATTGGCATCTGT GTCTACGT GATCCCAGACGGAGAGACTCGCAAGAT CAAGCAT CTA 1354 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1355 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1414 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1415 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1474 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1475 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1534 

Qy 781 AT G CACAAAAAGT AC C GCACAGACAAACAC CGAGGAATT AT C AT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1535 AT GCACAAAAAGT ACC GCACAGACAAACAC CGAGGAATT AT CAT AGAGACAGAGGGT GAC 1594 

Qy 841 CAC C CTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT C C CATTTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1595 CACCCTAAGGGCATT GAGATGGAT GGGAAAAT GATGAATTCCCATTTTCTAGATGGGAAC 1654 

Qy 901 CT GGTGC CC CTGGAAGGGAAGGAAGT GGAT GAGT C C CGCAGAGAGAT GAT CCGGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1655 CT GGTGCCC CTGGAAGGGAAGGAAGT GGAT GAGT CCCGCAGAGAGAT GAT C CGGAT T CT C 1714 



Qy 961 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCT GGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1715 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGT GGAGATGGCCAAT 1774 



Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1775 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1834 

Qy 1081 AT GAT GACTGGT GC AGGCAAT ATC CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I 1 I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II 
Db 1835 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1894 

Qy 1141 TC CAGCAT GAGCGAGGT GCACACC GAT GAGCCT GAGGACTTT AT TT C CAAGGT CTT CTT T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1895 TC CAGCAT GAGCGAGGTGCACACC GAT GAGCCT GAGGACTTT ATTT CCAAGGTCTT CTTT 1954 

Qy 1201 GACC C AT GTT CTT ACCAGT GCCTGGAGAACT GT GGGGCT GT ACT CCT GACAGTGGTGAGG 1260 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1955 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 2014 

Qy 1261 AAAGGGGGAGACAT GT CAAAGACCAT GT AT GT GGACT ACAAAAC AGAGGAT GGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2015 AAAGGGGGAGACAT GTCAAAGAC CAT GT AT GTGGACTACAAAACAGAGGAT GGTT CT GCC 2074 

Qy 1321 AAT GCAGGGGCT GACT AT GAGTTCAC AGAGGGCACGGT GGTT CT GAAGC C AGGAGAGAC C 1380 

i ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 n 1 1 1 1 1 1 1 1 1 

Db 2075 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGT GGTTCT GAAGCCAGGAGAGACC 2134 

Qy 1381 CAGAAGGAGTTCT CCGTGGGCATAATT GATGACGACATTTTTGAGGAGGATGAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2135 C AGAAGGAGTT CT CCGT GGGCATAAT T GAT GAC GACATT T TTGAGGAGGAT GAACACTT C 2194 

Qy 1441 TT T GTAAGGTT GAGCAAT GTCCGCAT AGAGGAGGAGC AGC CAGAGGAGGGGATGCCT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2195 TT T GTAAGGT T GAGCAAT GTCCGCAT AGAGGAGGAGC AGC CAGAGGAGGGGATGCCT CCA 2254 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2255 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2314 

Qy 1561 GTT AC CAT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACTTTT GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2315 GT T AC CAT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACTT T TGAAT GT GAT ACT ATT CAT 2374 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I II I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2375 GT CAGT GAGAGT AT T GGT GTT ATGGAGGT CAAGGTT CT GCGGAC AT CAGGT GCCCGGGGT 2434 

Qy 1681 ACAGT C AT CGT C CC CT TT AGGACAGTAGAAGGGACAGCCAAGGGT GGCGGT GAGGACT TT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2435 ACAGT CAT CGT C CC CTTTAGGACAGTAGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 2494 

Qy 1741 GAAGACACAT ATGGGGAGTTGGAATT CAAGAAT GAT GAAACT GT AT GT GACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 2495 GAAGACACAT AT GGGGAGTTGGAAT T CAAGAAT GAT GAAAC T GT GAAAAC CAT AAG 2550 

Qy 1801 GCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

Db 2551 GGT T AAAAT AGT AGAT GAGGAGGAATAC GAAAGGCAAGAGA 2591 
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ORIGIN 



CQ736275 1788 bp DNA linear PAT 03-FEB-2004 

Sequence 22209 from Patent WO02068579. 

CQ736275 

CQ736275.1 GI: 42330964 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Venter, C. J., Adams,M.C, Li,P.W. and Myers, E.W. 

Kits, such as nucleic acid arrays, comprising a majority of 

humanexons or transcripts, for detecting expression and other uses 

thereof 

Patent: WO 02068579-A 22209 06-SEP-2002; 
PE Corporation (NY) (US) 

Location/Qualifiers 

1. .1788 

/organism="Homo sapiens" 
/mo l_type="unas signed DNA" 
/db xref="taxon:9606" 



Query Match 95.7%; 
Best Local Similarity 99.9%; 
Matches 1784; Conservative 



Score 1782.8; 
Pred. No. 0; 
0; Mismatches 



DB 6; Length 1788; 

2; Indels 0; Gaps 



Qy 

Db 



0; 



ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 



Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



121 AC AGGGCAGAACAAT GAGT C CT GTT CAGGGT CAT CGGACTGCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
121 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT CCT G 180 

181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 CCAATCT GGT AC C CGGAGAACCCTT CC CTT GGGGACAAGAT T GCCAGGGT C ATT GT CTAT 240 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

301 T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 TCT ATT GAAGTCAT CACCT CT CAAGAGAGGGAGGT GACAAT TAAGAAACC CAAT GGAGAA 360 



Qy 

Db 



361 
361 



ACCAGC ACAACC ACT ATT CGGGT CT GGAAT GAAACT GT CT C CAAC CT GACCCTTAT GGCC 
I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACCAGCACAACAACTAT T C GGGT CT GGAAT GAAACT GT CT C CAAC CT GACCCTTAT GGC C 



420 
420 



Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 AT T GCT GGT GAT CT GGGAC CTT CT AC CATT GT AGGGAGT GCAGCCTT CAACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 AT T GCT GGT GAT CT GGGACCTT CT AC CATTGTAGGGAGT GCAGCCTT CAACAT GTT CAT C 54 0 

Qy 541 AT C ATT GGCAT CTGT GT CT AC GT GAT CCCAGAC GGAGAGACT CGCAAGAT CAAGC AT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 AT CATT GGCAT CT GT GT CT AC GT GAT CC C AGACGGAGAGACT C GCAAGAT CAAGCAT CTA 600 

Qy 601 CGAGT CTT CTT CAT CAC CGCTGCTT GGAGT ATCTTT GCCT AC ATCT GGCT CT ATAT GATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 601 CGAGTCTTCTTCATCACCGCTGCTT GGAGT ATCTTTGCCTACATCTGGCTCTAT AT GATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GC ACAAAAAGT AC C GC ACAGACAAACACCGAGGAATT AT CATAGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

Qy 841 CAC CCTAAGGGC ATT GAGAT GGAT GGGAAAATGATGAATT CCC ATTTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 CACCCTAAGGGCATT GAGAT GGAT GGGAAAATGATGAATT CCCATTTT CT AGAT GGGAAC 900 

Qy 901 CT GGT GCCCCT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GAT CC GGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 901 CT G GT GCC CCT GGAAGGGAAGGAAGT GGAT GAGT CC C GCAGAGAGAT GAT CC GGAT T CT C 960 

Qy 961 AAGGAT CT GAAGCAAAAACAC C CAGAGAAGGACTTAGAT C AGCTGGTGGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 AAGGAT CT GAAGCAAAAACAC C CAGAGAAGGACTTAGAT CAGCT GGT GGAGAT GGCCAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

Qy 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACATGCAGCAGAACAAGC CAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 1140 

Qy 1141 T C CAGCAT GAGCGAGGT GCACACCGAT GAGC CT GAGGACT TT ATTT C CAAGGT CTT CTTT 1200 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 TC CAGCAT GAGCGAGGT GCAC AC C GAT GAGCCT GAGGACTTT ATTT CCAAGGTCTT CTT T 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 GAC CC ATGT TCT T ACCAGT GC CT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGT GAGG 1260 



Qy 1261 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAAC AGAGGAT GGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1261 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GTGGACT ACAAAAC AGAGGAT GGTT CT GCC 1320 

Qy 1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 AATGCAGGGGCT GACTATGAGTTCACAGAGGGCACGGTGGTTCT GAAGCCAGGAGAGACC 1380 

Qy 1381 CAGAAGGAGTT CTC CGT GGGCATAATT GAT GACGACATT TT T GAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGAAGGAGTT CTC CGT GGGCATAATT GAT GACGACATT TTT GAGGAGGAT GAAC ACTTC 1440 

Qy 1441 T TT GTAAGGT T GAGCAATGT CC GCAT AGAGGAGGAGCAGC C AGAGGAGGGGAT GC CT CCA 1500 

I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I 
Db 14 41 TTT GTAAGGT T GAGCAAT GT CCGCAT AGAGGAGGAGC AGCCAGAGGAGGGGAT GCCT CCA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GTT AC C AT CTT G GAT GAT GAC CAT GC AGGC AT CTT C ACTTT T GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GTT AC C AT CT T GGAT GAT GAC CAT GC AGGCAT CTT CACTTTT GAAT GT GAT ACT ATT CAT 1620 

Qy 1621 GT CAGT GAGAGT AT T GGTGTT AT GGAGGT CAAGGTT CTGCGGACAT CAGGT GCCC GGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

Qy 1681 ACAGT CAT C GT C CC CTT T AGGAC AGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1681 ACAGT CAT CGT C CC CT T TAGGACAGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 1740 

Qy 1741 GAAGACAC AT AT GGGGAGTT GGAAT T CAAGAAT GAT GAAACT GTAT 1786 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I 

Db 1741 GAAGACAC AT AT GGGGAGTT GGAAT T CAAGAAT GAT GAAACT GT GT 1786 
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AX476820 126512 bp DNA linear PAT 12-AUG-2002 

Sequence 3 from Patent WO0233086. 

AX476820 

AX476820.1 GI: 22216099 

Homo sapiens (human) 
Homo sapiens „ . 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Merkulov, G. V. , Ketchum, K. A. , Shao,W., Yan,C, di Francesco, V. and 
Beasley, E.M. 

Isolated human transporter proteins, nucleic acid molecules 
encoding human transporter proteins, and uses thereof 
Patent: WO 0233086-A 3 25-APR-2002; 
PE Corporation (NY) (US) 

Location/Qualifiers 

1. .126512 



/organism="Homo sapiens" 
/mol_type="unas signed DNA" 
/db xref="taxon:9606" 



ORIGIN 



Query Match 95.7%; 
Best Local Similarity 99.9%; 
Matches 1784; Conservative 



Score 1782.8; 
Pred. No. 0; 
0; Mismatches 



DB 6; Length 126512; 



2; Indels 



0; Gaps 



0; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2010 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 2069 



Qy 



Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
2070 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 2129 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



121 ACAGGGCAGAACAATGAGT C CT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2130 ACAGGGCAGAACAATGAGT CCT GT T CAGGGTCAT CGGACT GCAAGGAGGGT GT CAT CCT G 2189 



181 



240 



CCAAT CT GGT ACC C GGAGAAC CCT T C C CTT GGGGACAAGAT T GCCAGGGTC ATTGT CT AT 

I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2190 C C AAT CT G GT AC C C GGAGAAC C CT T C C CT T GG GGACAAGAT T GC CAGGGT CAT T GT CT AT 2249 



241 



2250 



301 



TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 



T CTATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2310 TCTATT GAAGTCATCACCT CTCAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAA 

361 ACC AGC ACAACC ACT ATTC GGGT CT GGAAT GAAACTGT CT C CAAC CT GACC CT TAT GGCC 
I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
2370 ACC AGC ACAACAACT ATT C GGGT CT GGAAT GAAACTGT CT CCAAC CT GACC CTT AT GGCC 



300 



2309 



360 



2369 



420 



2429 



421 



480 



CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 2489 

481 ATT GCT GGT GAT CT GGGACCTT CT ACC AT T GT AGGGAGT GCAGC CT T CAACAT GTT CAT C 540 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2490 ATT GCTGGT GAT CT GGGACCTT CT AC CAT T GT AGGGAGT GCAGC CT T CAACAT GTT CAT C 2549 

541 ATCATT GGCAT CT GTGT CT ACGT GAT CCCAGAC GGAGAGACT CGCAAGAT CAAGCATCT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2550 AT CAT T GGCAT CT GTGT CT AC GT GAT CCCAGAC GGAGAGACT C GCAAGAT CAAGCATCT A 2609 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2610 C GAGT CT T CT T CAT CAC CGCT GCT T GGAGT AT CT TT GCCT ACAT CT GGCT CTAT AT GATT 2669 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
2670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 2729 



Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2730 T T TCCAGTGT GT GT C CTTCT GGCCT GGGT GGCAGATAAAC GACT GCT CTT CT ACAAATAC 2789 

Qy 781 AT GCACAAAAAGTAC C GCACAGACAAACAC CGAGGAATT AT C AT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 2790 AT GC ACAAAAAGT ACC GCACAGACAAAC ACC GAGGAATT AT CAT AGAGACAGAGGGT GAC 2849 

Qy 841 CACC CT AAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAATT CCCATTTTCTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 2850 CACCCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT CCCATTTTCTAGAT GGGAAC 2909 

Qy 901 CT GGT GCCCCT GGAAGGGAAGGAAGT GGAT GAGT C C CGCAGAGAGAT GAT CC GGATTCT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2910 CT GGT GCCC CT GGAAGGGAAGGAAGT GGAT GAGT C CCGCAGAGAGAT GAT CC GGATT CT C 2969 

Qy 961 AAGGAT CTGAAGCAAAAAC ACC CAGAGAAGGACTT AGAT C AGCT GGT GGAGATGGCCAAT 1020 

I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2970 AAGGAT CTGAAGCAAAAAC ACC CAGAGAAGGACTT AGAT C AGCT GGT GGAGATGGCCAAT 3029 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 3030 TACT AT GCT CT T TC CCACCAACAGAAGAGC CGCGCCTT CT ACCGTAT CCAAGCCACT CGT 3089 

Qy 1081 AT GAT GACT GGT GC AGGCAAT AT C CT GAAGAAAC AT GCAGC AGAAC AAGC CAAGAAGGC C 1140 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3090 AT GAT GACT GGT GC AGGCAAT AT CCT GAAGAAAC AT GCAGCAGAACAAGC CAAGAAGGC C 3149 

Qy 1141 T C CAGCAT GAGC GAGGT GC ACACC GAT GAGCCTGAGGACTTT ATTT C CAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3150 T CCAGCAT GAGC GAGGT GCACACCGAT GAGCCT GAGGACTTT ATTT CCAAGGTCTT CTTT 3209 

Qy 1201 GACC CAT GTT CT T ACCAGT GCCT GGAGAACT GT GGGGCT GT ACT C CT GAC AGTGGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3210 GACCCAT GTT CT TACCAGT GC CT GGAGAACT GT GGGGCT GT ACT C CT GAC AGT GGT GAGG 3269 

Qy 1261 AAAGGGGGAGACAT GTCAAAGACCATGTATGT GGACTACAAAACAGAGGAT GGTTCTGCC 1320 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 3270 AAAGGGGGAGACAT GT CAAAGACCAT GTATGT GGACTACAAAACAGAGGAT GGTTCTGCC 3329 

Qy 1321 AAT GCAGGGGCT GACT ATGAGTT CAC AGAGGGCAC GGTGGTT CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3330 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 3389 

Qy 1381 CAGAAGGAGTT CT CCGT GGGCATAATT GAT GACGACATTTTTGAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I l-l l-l I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3390 CAGAAGGAGTT CT CC GT GGGCATAATT GAT GACGACATTTT T GAGGAGGAT GAACACTT C 3449 

Qy 1441 T T T GTAAGGT T GAG CAATGT C C GCAT AGAGGAGGAGC AGC CAGAGGAGGGGAT GC CT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3450 TTTGTAAGGT T GAGCAATGT C C GCAT AGAGGAGGAGC AGC CAGAGGAGGGGATGCCT CCA 3509 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 3569 

Qy 1561 GT T ACC AT CTT GGAT GAT GACCAT GCAGGCAT CTT CACTTT T GAAT GT GAT ACT ATT CAT 1620 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
3570 GTTACCATCTTGGATGATGACCATGCAGGCATCTTCACTTTTGAATGTGATACTATTCAT * 3629 



Qy 1621 GTCAGT GAGAGT ATTGGT GTT ATGGAGGTCAAGGTT CT GC GGACAT CAGGT GCCCGGGGT 1680 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 3630 GTCAGT GAGAGT ATT GGT GTT AT GGAGGT CAAGGTT CT GC GGACAT CAGGT GCCC GGGGT 3689 

Qy 1681 ACAGT CAT C GT C C CCTTT AGGAC AGT AGAAGGGACAGC CAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3690 ACAGT CAT C GT CC CCT TT AGGACAGT AGAAGGGACAGCCAAGGGT GGCGGTGAGGACTTT 3749 

Qy 1741 GAAGACACAT AT GGGGAGTTGGAAT T CAAGAAT GATGAAACT GTAT 1786 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3750 GAAGACACAT AT GGGGAGTTGGAATTCAAGAAT GATGAAACTGTGT 3795 
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AF508982 145118 bp DNA 

Homo sapiens Na+/Ca2+ exchanger isoform 3 
region and complete cds . 
AF508982 

AF508982.1 GI: 22087482 



linear 
(SLC8A3) 



PRI 
gene 



24-OCT-2002 
promoter 



Craniata ; Vertebrata ; Euteleos tomi ; 
Catarrhini; Hominidae; Homo. 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 145118) 

Gabellini,N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli,E. 
The human SLC8A3 gene and the tissue-specific Na+/Ca2+ exchanger 3 
i so forms 

Gene 298 (1) , 1-7 (2002) 

2 (bases 1 to 145118) 

Gabellini,N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli / E. 
Control of theNa+/Ca2+ exchanger 3 promoter by cAMP and Ca2+ in 
differentiating neurons 
Unpublished 

3 (bases 1 to 145118) 

Gabellini,N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli,E. 
Direct Submission 

Submitted ( 02-MAY-2002 ) Department of Biology, University of 
Padova, via G. Colombo 3, Padova, PD 35131, Italy 
Location/Qualifiers 
1. .145118 
/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/chromosome="14" 
/map="14q24.2" 
gene 1. .145118 

/gene="SLC8A3" 
promoter 1. .263 

/gene="SLC8A3" 
TATAjsignal 236. .241 

/gene="SLC8A3" 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



mRNA 
,133539, 



5 ! UTR 
CDS 



3 1 UTR 

polyA_signal 



join(264. .955,20853. .22698,128396. .128499,133522. 

137221. .137345,138228. .138327,140293. .140568, 

143012. .145118) 

/gene="SLC8A3" 

/product="Na+/Ca2+ exchanger isoform 3" 
join(264. .955,20853. .20914) 
/gene="SLC8A3" 

join (20915. .22698,128396. .128499, 133522. .133539, 
137221. .137345,138228. .138327,140293. .140568, 
143012. .143388) 
/gene="SLC8A3 " 

/note= ,f NCX3; expressed in excitable cells of brain, 

retina, and skeletal muscle" 

/codon_start=l 

/product="Na+/Ca2+ exchanger isoform 3" 
/protein_id="AAM90955 . 1" 
/db_xref="GI: 22087483" 

/translati on= "MAWLRLQ PLT S AFLH FGLVT FVL FLNGLRAEAGGS GDVP S TGQN 

NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 

EVITSQEREVTIKKPNGETSTTTIRVWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 

I AGDLGP ST I VGSAAFNMFI I IGICVYVI P DGET RKI KHLRVFFI TAAWS I FAYIWLY 

MI LAVFS PGWQVWEGLLTLFFFPVCVLLAWVADKRLLFYKYMHKKYRTDKHRGI HE 

TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 

L VEMAN Y YAL S HQQ K S RAF YRI Q AT RMMT GAGN I LKKHAAEQ AKKAS SMS EVHT DE P E 

DFISKVFFDPCSYQCLENCGAVLLTWRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 

GTWLKPGETQKEFSVGI I DDDI FEEDEHFFVRLSNVRI EEEQPEEGMPPAI FNSLPL 

P RAVLAS P CVATVT I L D DDHAG I FT FECDT I HVS ESI GVMEVKVL RT S GARGT VT VP F 

RTVEGTAKGGGEDFEDTYGELEFKNDETVKTIRVKIVDEEEYERQENFFIALGEPKWM 

ERGISALLLSPDVTDRKLTMEEEEAKRIAEMGKPVLGEHPKLEVIIEESYEFKTTVDK 

L I KKTNLAL WGTHS WRDQ FMEAI TVS AAGDEDEDES GEERL P S C FD YVMH FLT VFWK 

VL FAC VP PT E YCHGWAC FAVS I L 1 1 GMLT AI I G DLAS H FGCT I GL KD S VT AWFVAFG 

T S VP DT FAS KAAALQDVYADAS I GNVT GS NAVNVFLG I GLAW S VAAI YWALQGQEFHV 

SAGTLAPSVTLFTIFAFVCISVLLYRRRPHLGGELGGPRGCKLATTWLFVSLWLLYIL 

FATLEAYCYIKGF" 

143389. .145118 

/gene="SLC8A3" 

145089. .145094 

/gene="SLC8A3" 



ORIGIN 



Query Match 95.7%; 
Best Local Similarity 99.9%; 
Matches 1784; Conservative 



Score 1782.8; 
Pred. No. 0; 
0; Mismatches 



DB 9; Length 145118; 



2; Indels 



0 ; Gaps 



0; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 20915 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 20974 



Qy 

Db 

Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
20975 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 21034 



121 



180 



ACAGGGCAGAACAAT GAGTCCT GTTCAGGGT CATCGGACTGCAAGGAGGGT GT CATCCTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

21035 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT C CT G 21094 



Qy 181 CCAAT CT GGT AC CC GGAGAAC C CTT C CCT TGGGGACAAGATT GC CAGGGTCATT GT CTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I t I I I I I I II I I I 
Db 21095 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 21154 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21155 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 21214 

Qy 301 T CTATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21215 TCTATTGAAGTCATCACCTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 21274 

Qy 361 ACCAGCACAACC ACT AT TCGGGT CT GGAAT GAAACT GTCT C CAACCT GACCCTT AT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21275 AC CAGCACAACC ACT ATTCGGGT CT GGAAT GAAACT GT CT C CAACCT GAC C CTT AT GGCC 21334 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21335 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 21394 

Qy 481 ATTGCT GGT GAT CT GGGACCTT CT ACCATT GT AGGGAGT GCAGC CTT CAACAT GTT CAT C 540 

I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 21395 ATTGCT GGT GAT CT GGGACCTT CT ACCATT GT AGGGAGT GCAGCCT T CAACAT GTT CAT C 21454 

Qy 541 AT CATTGGCATCTGTGTCTACGTGATCCCAGACGGAGAGACT CGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 21455 AT CATTGGCATCTGTGTCTACGTGATCCCAGACGGAGAGACT CGCAAGATCAAGCATCTA 21514 

Qy 601 C GAGT CTT CT T CAT C AC CGCT GCTT GGAGT AT CTT T GCCT ACAT CT GGCT CT AT AT GATT 660 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 21515 C GAGT CTT CT T CAT C AC CGCT GCTT GGAGT AT CTT T GCCT ACAT CT GGCT CTAT AT GATT 21574 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21575 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 21634 

Qy 721 TT TC CAGTGT GT GT C CT TCT GGCCTGGGT GGCAGATAAAC GACT GCT CTTCT ACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 21635 T T T C CAGTGT GT GT C CTTCT GGCCT GGGT GGCAGATAAAC GACT GCT CTT CT ACAAATAC 21694 

Qy 781 AT GCACAAAAAGT AC CGCACAGACAAACACCGAGGAATT AT CAT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 21695 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 21754 

Qy 841 C ACC CT AAGGG CAT T GAGAT GGAT GGGAAAAT GAT GAAT T C C CATTTTCTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 21755 CACCCTAAGGGCATTGAGATGGAT GGGAAAAT GATGAATTCCCATTTTCTAGATGGGAAC 21814 

Qy 901 CT GGT GC CCCT GGAAGGGAAGGAAGT GGAT GAGT C CCGC AGAGAGAT GAT C C GGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21815 CT GGT GC CCCT GGAAGGGAAGGAAGT GGAT GAGT CCC GC AGAGAGAT GAT C C GGATT CT C 21874 

Qy 961 AAGGAT CTGAAGCAAAAACAC C CAGAGAAGGACTT AGAT CAGCT GGT GGAGATGGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21875 AAGGAT CTGAAGCAAAAACACC CAGAGAAGGACTT AGAT CAGCT GGT GGAGATGGC CAAT 21934 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 21935 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 21994 



Qy 1081 AT GAT GACTGGT GCAGGCAAT ATC CT GAAGAAACAT GCAGC AGAACAAGCCAAGAAGGC C 1140 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21995 AT GAT GACTGGT GCAGGCAAT AT C CT GAAGAAACAT GCAGC AGAACAAGCCAAGAAGGCC 22054 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 22055 T CCAGCAT GAGC GAGGTGCAC AC CGAT GAGCCT GAGGACTTTATTT CCAAGGTCTTCTTT 22114 

Qy 1201 GACC C AT GTT CTTACCAGT GC CTGGAGAACT GT GGGGCTGTACT CCT GACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I II 
Db 22115 GACC CAT GTT CTT AC CAGT GC CT GGAGAACTGT GGGGCTGTACT CCT GACAGTGGT GAGG 22174 

Qy 1261 AAAGGGGGAGAC AT GT CAAAGACCAT GT AT GT GGACT ACAAAAC AGAGGAT GGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 22175 AAAGGGGGAGAC AT GT CAAAGACCAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CTGCC 22234 

Qy 1321 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGT GGTTCT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 22235 AAT GCAGGGGCT GACT AT GAGT TCACAGAGGGC ACGGTGGTTCT GAAGC CAGGAGAGACC 22294 

Qy 1381 CAGAAGGAGTT CT CCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 1440 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I II I I 
Db 22295 CAGAAGGAGTT CT CC GTGGGC ATAAT T GAT GAC GACATTT TTGAGGAGGAT GAACACTT C 22354 

Qy 1441 TTT GTAAGGT T GAGCAAT GT C C GCATAGAGGAGGAGC AGC C AGAGGAGGGGATGCCT C CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 22355 TTT GTAAGGT T GAGCAAT GTC C GCATAGAGGAGGAGCAGC C AGAGGAGGGGATGCCT CCA 22414 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 22415 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 22474 

Qy 1561 GTT AC CAT CTT GGAT GAT GAC CAT GCAGGCAT CTTC ACTTTT GAAT GT GATACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 22475 GTTACCAT CTT GGAT GAT GAC CAT GCAGGCAT CTTCACT TTT GAAT GT GATACT ATT CAT 22534 

Qy 1621 GT CAGT GAGAGT ATT GGT GTT AT GGAGGT CAAGGT T CT GC GGAC AT C AGGT GCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 22535 GT CAGTGAGAGTATT GGT GTT AT GGAGGT CAAGGT T CT GCGGACAT CAGGT GCCCGGGGT 22594 

Qy 1681 AC AGT CAT CGT C CCCTTTAGGACAGT AGAAGGGAC AGC CAAGGGT GGCGGT GAGGACTTT 1740 

I II I I I I I I I I I I I II II I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 22595 ACAGT CAT CGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 22654 

Qy 1741 GAAGAC AC AT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACTGT AT 1786 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 22655 GAAGACACATAT GGGGAGTT GGAATT CAAGAAT GAT GAAACTGTGT 22700 
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AC009607 

LOCUS AC009607 146055 bp DNA linear HTG 04-MAY-2001 

DEFINITION Homo sapiens clone RP11-1I11, WORKING DRAFT SEQUENCE, 31 unordered 
pieces . 
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VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 



AC009607 

AC009607.3 GI : 8072446 

HTG; HTGS_PHASE1; HTGS_DRAFT. 

Homo sapiens (human) 

Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 146055) 

Birren,B., Linton, L., Nusbaum, C. and Lander, E. 

Homo sapiens, clone RP11-1I11 

Unpublished 

2 (bases 1 to 146055) 

Birren,B., Linton, L., Nusbaum, C, Lander, E., Allen, N., Anderson, M. , 
Baker, J. , Baldwin, J., Barna,N., Beckerly,R., Benn,J., Brown, A. , 
Castle, A., Cerny,J., Colangelo,M. , Collins, S ., Collymore, A. , 
Cooke, P., DeArellano, K. , Depayre,E., Devon, K. , Dewar,K., 
Donelan,L., Doyle, M. , Ferreira,P., FitzHugh,W., Forrest, C, 
Funke,R., Gage,D., Galagan,J., Gardyna,S., Gilbert, D., Grant, G., 
Hagos,B., Heaford,A. , Horton,L., Howland, J. C. , Jones, C, Kann,L., 
Karatas,A. , Lehoczky,J., Lieu,C, Locke, K. , Macdonald, P . , 
Marquis, N., McEwan,P., McGurk, A. , McKernan,K., McLaughlin, J. , 
Meldrim, J. , Molla,M. , Morris, W., Morrow, J., Mychaleckyj , J. , 
Naylor,J., Niloff,M., 0'Connor,T., 0 1 Donnell, P . , Pavlin,B., 
Peterson, K., Pollara,V., Riley, R. , Roberts, D. , Roy, A., Severy,P., 
Stange-Thomann,N. , Stoj anovic, N. , Stone, C. , Subramanian, A. , 
Tesfaye,S., Torruella-Miller, I . , Vassiliev, H . , Vo,A., Wagner, A. , 
Wheeler, J., Wu,X., Wyman,D., Ye, W.J. and Zody,M. 
Direct Submission 

Submitted (28-AUG-1999) Whitehead Institute/MIT Center for Genome 

Research, 320 Charles Street, Cambridge, MA 02141, USA 

On May 25, 2000 this sequence version replaced gi: 7321520. 

All repeats were identified using RepeatMasker : 

Smit, A.F.A. & Green, P. (1996-1997) 

http : / / ftp . genome . Washington . edu/RM/ RepeatMasker . html 
Genome Center 

Center: Whitehead Institute/ MIT Center for Genome Research 

Center code: WIBR 

Web site: http://www-seq.wi.mit.edu 

Contact: sequence_submissions@genome.wi.mit.edu 
Project Information 

Center project name: L1464 

Center clone name: 1_I_11 
Summary Statistics 

Sequencing vector: M13; M77815; 99% of reads 

Sequencing vector: Plasmid; n/a; %-0.f%% of reads 

0.776287932251235Chemistry: Dye-primer-amersham; 6% of .reads 

Chemistry: Dye-terminator Big Dye; 94% of reads 

Assembly program: Phrap; version 0.960731 

Consensus quality: 126247 bases at least Q40 

Consensus quality: 134710 bases at least Q30 

Consensus quality: 138332 bases at least Q20 

Insert size: 160000; agarose-fp 

Insert size: 143055; sum-of-contigs 

Quality coverag. 

* NOTE: This is a 'working draft 1 sequence. It currently 

* consists of 31 contigs . The true order of the pieces 

* is not known and their order in this sequence record is 



arbitrary. Gaps between the contigs are represented as 
runs of N, but the exact sizes of the gaps are unknown. 
This record will be updated with the finished sequence 
as soon as it is available and the accession number will 
be preserved. 
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; contig 
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length 
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length 
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length 
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bp 
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bp 
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bp 
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length 
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bp 
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length 
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100 bp 








13932 


16132 


contig 
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bp 
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length 
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bp 
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length 
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contig 


of 2018 


bp 


in 


length 
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100 bp 
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22565 


contig 
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bp 
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length 
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100 bp 
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contig 
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bp 


in 


length 
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25024 
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100 bp 
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bp 
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length 
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100 bp 
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contig 
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bp 
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100 bp 
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contig 
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bp 
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length 
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100 bp 








33904 
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contig 
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bp 
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length 
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38277 
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100 bp 
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contig 


of 3855 


bp 


in 


length 
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gap of 


100 bp 
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: contig 
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bp 
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length 
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100 bp 
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: contig 
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bp 
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length 
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100 bp 
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: contig 
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bp 
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length 
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100 bp 
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: contig 
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bp 
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length 
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: contig 
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length 
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bp 


in 


length 
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100 bp 
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100 bp 








■A- 


86114 


98467: 


contig 


of 12354 


bp 


in 


length 
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100 bp 
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bp 
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length 
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gap of 


100 bp 
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bp 


in 


length 
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gap of 


100 bp 
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bp 


in 
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1. .146055 

/organism="Homo sapiens" 
/ mo l_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/clone="RPll-Hll" 

/clone lib="RPCI-ll Human Male BAC" 
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ORIGIN 



Query Match 95.7%; Score 1782.8; DB 2; Length 146055; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1784; Conservative 0; Mismatches 2; Indels 0; Gaps 0 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 138575 ATGGCGTGGTTAAGGTTGCAGCCTCTGACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 

138634 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 1 I I I I I I I 
Db 138635 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 

138694 



Qy 121 ACAGGGCAGAACAATGAGTCCT GTTCAGGGTCATCGGACT GCAAGGAGGGTGTCATCCTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 138695 ACAGGGCAGAACAATGAGT C CT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCTG 

138754 

Qy 181 CCAAT CT GGT ACC CGGAGAAC C CTT CC CT T GGGGACAAGATT GCCAGGGT CATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 138755 CCAAT CT GGTACC CGGAGAAC CCTT CC CT T GGGGACAAGATT GCCAGGGT CATT GT CT AT 

138814 



Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 138815 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 

138874 



Qy 



301 T CT AT T GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT T AAGAAACCCAAT GGAGAA 360 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 138875 TCTATTGAAGTCATCACCTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 

138934 

Qy 361 AC CAGCACAACCACT ATT C GGGT CT GGAAT GAAACT GT CTC CAAC CT GACC CTT AT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 138935 ACCAGCACAACCACT ATT C GGGT CT GGAAT GAAACT GT CTC CAAC CT GAC C CTTAT GGCC 

138994 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 138995 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 

139054 

Qy 481 ATT GCT GGT GAT CTGGGACCTT CT AC CATT GT AGGGAGT GCAGCCTT CAACAT GTT CATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139055 ATT GCT GGT GAT CTGGGACCT T CT AC CATT GT AGGGAGT GCAGCCTT CAACAT GTT CATC 

139114 

Qy 541 AT CATT GGCAT CT GT GTCT AC GT GAT CC CAGAC GGAGAGACT CGCAAGATCAAGCAT CT A 600 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139115 AT CATT GGCAT CT GT GTCT AC GT GAT C C CAGACGGAGAGACT CGCAAGAT CAAGCAT CT A 

139174 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 139175 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 

139234 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139235 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 

139294 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139295 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 

139354 

Qy 781 AT GCACAAAAAGT AC C GC ACAGACAAACACC GAGGAAT TAT C AT AGAGACAGAGGGT GAC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139355 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 

139414 

Qy 841 CACCCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT CCCAT TT T CTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 139415 CACC CTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAAT TCCCATTT TCTAGAT GGGAAC 

139474 

Qy 901 CT GGT GC CC CTGGAAGGGAAGGAAGT GGAT GAGT C CC GC AGAGAGAT GAT CCGGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 139475 CTGGT GCCC CTGGAAGGGAAGGAAGT GGAT GAGT CCC GC AGAGAGAT GAT CC GGATT CT C 

139534 

Qy 961 AAGGAT CTGAAGCAAAAACAC C C AGAGAAGGACTT AGAT CAGCT GGT GGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

139594 



139535 AAGGAT CTGAAGCAAAAACAC CC AGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC CAAT 



Qy 1021 TACT AT GCT CTTT C CC AC CAAC AGAAGAGC C GC GC CTT CT AC CGT AT CCAAGC C ACT C GT 1080 

I I I I I I I I I I I II I I I I I I I I 1 I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 139595 TACT AT GCT CTTT CC C AC CAACAGAAGAGCCGT GC CTT CT AC CGT AT CCAAGC CACT CGT 

139654 

Qy 1081 ATGATGACTGGT GCAGGCAATATCCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 139655 ATGATGACTGGT GCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 

139714 

Qy 1141 T CCAGCATGAGC GAGGT GCACACCGAT GAGC CT GAGGACTTT ATT T CCAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 139715 T CCAGCATGAGC GAGGT GCACACCGAT GAGC CT GAGGACTT TATTT CCAAGGT CTT CTTT 

139774 

Qy 1201 GACCCAT GTT CT T AC CAGT GC CT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139775 GACCCAT GTT CTTAC CAGT GCCT GGAGAACT GT GGGGCT GTACT CCT GACAGT GGT GAGG 

139834 

Qy 1261 AAAGGGGGAGACATGTCAAAGACCATGTATGT GGACTACAAAACAGAGGAT GGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 139835 AAAGGGGGAGACATGT CAAAGAC CAT GT AT GT GGACTACAAAACAGAGGAT GGTTCT GCC 

139894 

Qy 1321 AAT GCAGGGGCT GACT AT GAGT T CACAGAGGGC AC GGT GGT T CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139895 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGC AC GGT GGT T CT GAAGCCAGGAGAGACC 

139954 

Qy 1381 CAGAAGGAGT TCT CC GT GGGCATAATT GAT GAC GACATT TTT GAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139955 CAGAAGGAGTTCT CCGTGGGCATAATTGATGACGACATTTTTGAGGAGGAT GAACACTTC 

140014 

Qy 1441 TTT GTAAGGT T GAGCAAT GT C C GC AT AGAGGAGGAGC AGCCAGAGGAGGGGAT GC CT C CA 1500 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 140015 T TT GTAAGGT T GAGCAAT GT C C GCAT AGAGGAGGAGC AGCCAGAGGAGGGGAT GCCT CCA 

140074 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 140075 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 

140134 

Qy 1561 GTTACCATCTTGGAT GAT GACCATGCAGGCATCTT CACTTTTGAATGTGATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 140135 GTTACCATCTTGGAT GATGACCAT GCAGGCATCTT CACTTTT GAATGTGATACTATTCAT 

140194 

Qy 1621 GT CAGT GAGAGT ATT GGT GTT AT GGAGGT CAAGGTT CT GCGGACATCAGGT GCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 140195 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 

140254 



Qy 1681 AC AGT CATC GT CCCCT T T AGGACAGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I II I I I I I I I II I I I I I I I I I 
Db 140255 ACAGTCATCGT C CCCTT T AGGACAGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 

140314 

Qy 1741 GAAGACACAT AT GGGGAGT T GGAAT T CAAGAATGAT GAAACT GT AT 1786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 140315 GAAGACACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT GT 140360 
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ALIGNMENTS 



RESULT 1 . . 

ABQ78862 

ID ABQ78862 standard; cDNA; 1863 BP. 
XX 

AC ABQ78862; 
XX 

DT 09-OCT-2002 (first entry) 
XX 

DE Human ion exchanger protein #2 cDNA. 
XX 

KW Human; ion exchanger protein; NHIEP; nootropic; cytostatic; gene therapy; 
KW antiarthritic; virucide; chemotherapeutic; cancer; arthritis; antiviral; 



KW gene; ss; chromosome 14. 
XX 

OS Homo sapiens . 
XX 

FH Key Location/Qualifiers 

FT CDS 1. .1863 

FT /*tag= a 

FT /product= "Ion exchanger protein 2" 
XX 

PN WO200259316-A2. 
XX 

PD 01-AUG-2002. 
XX 

PF 22-JAN-2002; 2002WO-US001817 . 
XX 

PR 23-JAN-2001; 2001US-0263384P . 
XX 

PA (LEXI-) LEXICON GENETICS INC. 
XX 

PI Friddle CJ, Hilbun E; 
XX 

DR WPI; 2002-599791/64. 

DR P-PSDB; ABB81914. 
XX 

PT Novel polynucleotides encoding human ion exchanger proteins that are 

PT structurally related to mammalian sodium- calcium exchanger proteins, 

PT useful for drug screening, diagnosis and in gene therapy of biological 

PT disorders. 
XX 

PS Disclosure; Page 39-40; 42pp; English. 
XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP) , 

CC that shares structural similarity with mammalian sodium- calcium exchanger 

CC proteins, and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 

CC or to therapeutically augment the efficacy of chemotherapeutic agents 

CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC sequence encodes a NHIEP of the invention 

XX 

SQ Sequence 1863 BP; 464 A; 426 C; 514 G; 459 T; 0 U; 0 Other; 

Query Match 100.0%; Score 1863; DB 6; Length 1863; 
Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1863; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 



Qy 



121 ACAGGGCAGAACAAT GAGT C CT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 180 
I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 121 AC AGGGC AGAACAAT GAGT C CT GT T CAGGGTCAT CGGACT GCAAGGAGGGT GT CAT CCT G 180 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I II I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 
Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGTGACAATT AAGAAACC CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II 
Db 301 T CT AT T GAAGT CAT CAC CT CT CAAGAGAGGGAGGTGACAATT AAGAAACC CAAT GGAGAA 360 

Qy 361 AC CAGC AC AAC CACT ATT C GGGT CT GGAAT GAAACT GTCT CCAACCTGAC CCTT AT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AC CAGC ACAAC CACT ATT C GGGT CT GGAAT GAAACT GTCT C CAACCT GACCCTT AT GGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 ATT GCT GGT GAT CT GGGAC CTT CT ACCATT GTAGGGAGT GCAGCCT T CAACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 AT T GCT GGT GAT CT GGGAC CTT CT AC CAT T GTAG GGAGT GCAGCCT T CAACAT GTT CAT C 540 

Qy 541 AT C ATT GGC AT CT GT GT CT ACGT GAT C CC AGACGGAGAGACT CGCAAGAT CAAGC AT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 AT CATT GGC AT CT GT GT CT AC GT GAT C C C AGACGGAGAGACT CGCAAGAT CAAGCAT CT A 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CGAGT CTT CTT CAT CAC CGCT GCTT GGAGT AT CT TT GCCT ACAT CT GGCT CT AT AT GATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GCACAAAAAGT ACCGC ACAGACAAAC AC CGAGGAATTAT C AT AGAGACAGAGGGT GAC 840 

I I I I I I I I I |J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AT GCACAAAAAGT ACCGCACAGACAAACAC C GAGGAATT AT CAT AGAGACAGAGGGT GAC 840 

Qy 841 CAC CCTAAGGGCATT GAGAT GGAT GGGAAAAT GATGAATT CCCAT T TT CTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 841 CAC CCTAAGGGC AT T GAGAT GGAT GGGAAAAT GAT GAATT CC CATTTT CTAGAT GGGAAC 900 

Qy 901 CT GGT GCC C CT GGAAGGGAAGGAAGT GGAT GAGT CC CGCAGAGAGAT GAT CCGGATT CT C 960 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CT GGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGATGAT C C GGAT T CT C 960 

Qy 961 AAGGAT CT GAAGCAAAAAC ACC C AGAGAAGGACTT AGAT CAGCT GGTGGAGATGGC CAAT 1020 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGTGGAGATGGCCAAT 1020 



1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I II I I I I I II I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 1 
1021 TACT AT GCT CTTT CCCACCAACAGAAGAGCC GCGCCTT CTAC CGTATCCAAGC CACT C GT 1080 

1081 AT GATGACT GGT GC AGGCAAT AT CCT GAAGAAAC AT GC AGCAGAACAAGCCAAGAAGGC C 1140 

I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 AT GATGACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

1141 T CCAGC AT GAGC GAGGT GCAC ACCGAT GAGC CT GAGGACTTT ATTTCCAAGGTCTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I 
1141 T CCAGCAT GAGC GAGGTGCAC ACCGAT GAGC CT GAGGACTTT AT TTCCAAGGT CTT CTTT 1200 

1201 GAC C CAT GTT CTT ACC AGT GC CT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
1201 GAC C CAT GTT CTT ACCAGT GC CT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGT GAGG 1260 

1261 AAAGGGGGAGACATGT CAAAGAC CAT GT AT GT GGACT ACAAAAC AGAGGAT GGTTCT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 AAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGTTCT GCC 1320 

1321 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGT GGTT CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1321 AAT GCAGGGGCT GAC TAT GAGTT CACAGAGGGCACGGTGGTT CT GAAGCCAGGAGAGACC 1380 

1381 CAGAAGGAGTT CT CC GT GGGCATAATT GAT GACGACATT TTT GAGGAGGATGAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 CAGAAGGAGTT CT CC GT GGGCATAAT T GAT GACGACATT TT T GAGGAGGAT GAAC ACTT C 1440 

1441 TTTGTAAGGTTGAGCAATGT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCT CCA 1500 

I I I I I I I I I I'l I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 TTT GTAAGGT TGAGCAAT GT C C GCAT AGAGGAGGAGC AGCCAGAGGAGGGGAT GCCT C CA 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

1561 GTT ACCAT CT T GGAT GAT GAC CAT GCAGGCAT CTT CACT TTT GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 GTT ACCAT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACT TTT GAATGT GAT ACT AT T CAT 1620 

1621 GT C AGT GAGAGT ATT GGT GTT AT GGAGGT CAAGGTT CT GCGGAC ATCAGGT GCCC GGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 GT CAGT GAGAGT ATT GGT GTTAT GGAGGT CAAGGTT CT GCGGACATCAGGT GCC CGGGGT 1680 

1681 AC AGTCAT CGTC C CCTTT AGGACAGT AGAAGGGAC AGC CAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 ACAGTC AT CGT C C CCTT T AGGACAGT AGAAGGGAC AGC CAAGGGT GGCGGT GAGGACTTT 1740 

1741 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT AT GT GACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 GAAGACACAT ATGGGGAGTT GGAATTCAAGAATGATGAAACT GTATGT GACAGACAGGAA 1800 

1801 GCT GACT AT GGAAGAAGAGGAGG CCAAGAGGATAGCAGAGAT GGGAAAGC CAGT ATT GGG 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 GCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGAT GGGAAAGC CAGT ATT GGG 1860 



Qy 1861 TGA 1863 

I I I 

Db 1861 TGA 1863 
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ABQ78861 

ID ABQ78861 standard; cDNA; 2766 BP. 
XX 

AC ABQ78861; 
XX 

DT 09-OCT-2002 (first entry) 
XX 

DE Human ion exchanger protein #1 cDNA. 
XX 

KW Human; ion exchanger protein; NHIEP; nootropic; cytostatic; gene therapy; 

KW antiarthritic; virucide; chemotherapeutic; cancer; arthritis; antiviral; 

KW gene; ss; chromosome 14. 
XX 

OS Homo sapiens . 
XX 

FH Key Location/Qualifiers 

FT CDS 1. .2766 

FT /*tag= a 

FT /product= "Ion exchanger protein 1" 
XX 

PN WO200259316-A2. 
XX 

PD 01-AUG-2002. 
XX 

PF 22-JAN-2002; 2002WO-US001817 . 
XX 

PR 23-JAN-2001; 2001US-0263384P . 
XX 

PA (LEXI-) LEXICON GENETICS INC. 
XX 

PI Friddle CJ, Hilbun E; 
XX 

DR WPI; 2002-599791/64. 

DR P-PSDB; ABB81913. 
XX 

PT Novel polynucleotides encoding human ion exchanger proteins that are 

PT structurally related to mammalian sodium- calcium exchanger proteins, 

PT useful for drug screening, diagnosis and in gene therapy of biological 

PT disorders. 
XX 

PS Claim 1; Page 36-37; 42pp; English. 
XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP) , 

CC that shares structural similarity with mammalian sodium-calcium exchanger 

CC proteins, and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 

CC or to therapeutically augment the efficacy of chemotherapeutic agents 

CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC sequence encodes a NHIEP of the invention 



XX 

SQ Sequence 2766 BP; 655 A; 678 C; 760 G; 673 T; 0 U; 0 Other; 



Query Match 95.8%; Score 1784.6; DB 6; Length 2766; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I II I I I I II II I I II I I I I I I I I I I I 
Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGC AGAACAAT GAGT C CT GT T CAGGGT CAT CGGACTGCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 ACAGGGCAGAACAAT GAGT CCT GTTCAGGGTCATCGGACTGCAAGGAGGGT GTCATCCTG 180 

Qy 181 C CAATCT GGT ACCCGGAGAAC C CT T C C CTT GGGGACAAGATT GC CAGGGT CATT GT CTAT 240 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I 
Db 181 C CAAT CT GGT ACCCGGAGAAC C CT T CC CTT GGGGACAAGAT T GC CAGGGT CATT GT CTAT 240 

Qy 241 T TT GTGGCCCTGATATACATGTTCCTTGGGGTGTC CAT CATT GCTGACCGCTT CAT GGCA 300 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 T TT GTGGCCCT GAT AT ACAT GT TC CTT GGGGT GT C CAT CATT GCT GAC CGCTT CAT GGCA 300 

Qy 301 T CT ATT GAAGT CATCACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAA 360 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 T CT ATT GAAGT CATC ACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAA 360 

Qy 361 ACCAGCACAACCACT ATT C GGGT CT GGAAT GAAACT GT CTC CAAC CT GAC C CTT AT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ACCAGCACAACCACT ATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 ATT GCT GGT GAT CTGGGAC CTT CT AC CAT T GT AGGGAGT GCAGC CTT CAACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 ATT GCT GGT GAT CTGGGAC CTT CT AC CATT GT AGGGAGT GCAGCCTT CAACATGTT CAT C 540 

Qy 541 AT CATT GGC AT CT GT GT CT ACGT GAT CCC AGACGGAGAGACT CGCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 AT CATT GGC ATCT GT GT CT ACGT GAT C C C AGACGGAGAGACT CGCAAGAT CAAGCAT CT A 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 C GAGTCTT CT TCAT CACCGCT GCT T GGAGT AT CTTT GC CT ACAT CTGGCT CTAT AT GATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

781 AT GCACAAAAAGT AC CGCACAGACAAACAC C GAGGAATT AT C AT AGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I I I I I II I I I I I I I II I I I II II I I I I I I I I I I I I I II I I I I II I I I I I 

781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

841 CAC CCTAAGGGC AT T GAGAT GGAT GGGAAAATGAT GAATT CC CAT TT T CTAGAT GGGAAC 900 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

841 CACCCTAAGGGC ATT GAGAT GGAT GGGAAAATGAT GAATT C C CAT T TT CT AGATGGGAAC 900 

901 CT GGT GCC C CT GGAAGGGAAGGAAGT GGAT GAGT CCCGCAGAGAGAT GAT CC GGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 CT GGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GAT CC GGATT CT C 960 

961 AAGGAT CT GAAGCAAAAACAC C CAGAGAAGGACT T AGAT C AGCTGGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 AAGGAT CT GAAGCAAAAACACC CAGAGAAGGACT TAGAT C AGCTGGTGGAGAT GGCCAAT 1020 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAAC AT GCAGC AGAACAAGC CAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

1081 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGC AGAACAAGC CAAGAAGGCC 1140 

1141 TCC AGC AT GAGCGAGGT GCAC AC CGAT GAGC CT GAGGACTTT AT T T CCAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1141 TC CAGCAT GAGCGAGGT GCACACCGAT GAGC CT GAGGACT TT AT T T CCAAGGT CTT CTTT 1200 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

1201 GAC CCATGTTCT T AC CAGT GCCT GGAGAACT GT GGGGCT GT ACTC CT GACAGT GGT GAGG 1260 

1261 AAAGGGGGAGACAT GTCAAAGACCATGTATGTGGACTACAAAACAGAGGAT GGTT CTGCC 1320 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 1320 



1261 



1321 AAT GC AGGGGCT GACT AT GAGTT C ACAGAGGGCACGGT GGTT CTGAAGC CAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1321 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGTGGTT CTGAAGC CAGGAGAGAC C 1380 

1381 CAGAAGGAGTT CT CCGT GGGC ATAATT GAT GAC GACATTT TT GAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 CAGAAGGAGTT CTCCGT GGGCATAATT GAT GAC GAC ATTT TT GAGGAGGAT GAACACTT C 1440 

1441 TTTGTAAGGTT GAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1441 TTTGTAAGGTT GAGCAATGT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

1561 GT T AC CAT CT T GGAT GAT GAC C AT GCAGGCAT CTTCACTTTT GAAT GT GAT ACT ATT CAT 1620 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 GTTACCAT CTT GGATGATGACCATGCAGGCATCTTCACTTTT GAAT GTGATAC TAT T CAT 1620 



Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 



Qy 1681 AC AGT CATC GT C CC CTT T AGGACAGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACTT T 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 AC AGT CAT C GT C CCCTT T AGGACAGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 1740 

Qy 1741 GAAGACACATAT GGGGAGTTGGAATT CAAGAATGATGAAACTGTATGTGACAGACAGGAA 1800 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I 11 I I I I I I I I I I I II I 

Db 1741 GAAGACACATAT GGGGAGT T GGAAT T CAAGAAT GAT GAAAC TGTGAAAACCATAAG 1796 

Qy 1801 GCT GACT AT GGAAGAAGAGGAGGC CAAGAGGATAGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

Db 1797 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 1837 



RESULT 3 
ABQ78864 

ID ABQ78864 standard; cDNA; 2766 BP. 
XX 

AC ABQ78864; 
XX 

DT 09-OCT-2002 (first entry) 
XX 

DE Human ion exchanger protein #1 cDNA A/G mutant. 
XX 

KW Human; ion exchanger protein; NHIEP; nootropic; cytostatic; gene therapy; 

KW antiarthritic; virucide; chemotherapeutic; cancer; arthritis; antiviral; 

KW gene; ss; mutant. 
XX 

OS Homo sapiens . 

OS Synthetic. 
XX 

FH Key Location/Qualif iers 

FT mutation replace ( 1889, A) 

FT /*tag= a 
XX 

PN WO200259316-A2. 
XX 

PD 01-AUG-2002. 
XX 

PF 22-JAN-2002; 2002WO-US001817 . 
XX 

PR 23-JAN-2001; 2001US-0263384P . 
XX 

PA (LEXI-) LEXICON GENETICS INC. 
XX 

PI Friddle CJ, Hilbun E; 
XX 

DR WPI; 2002-599791/64. 
XX 

PT Novel polynucleotides encoding human ion exchanger proteins that are 

PT structurally related to mammalian sodium- calcium exchanger proteins , 

PT useful for drug screening, diagnosis and in gene therapy of biological 

PT disorders. 



XX 

PS Disclosure; Page; 42pp; English. 
XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP) , 

CC that shares structural similarity with mammalian sodium- calcium exchanger 

CC proteins, and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 



CC or to therapeutically augment the efficacy of chemotherapeutic agents 

CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC sequence represents a mutant form of a NHIEP of the invention. Note: The 

CC present sequence is not shown in the specification but is derived from 

CC the human NHIEP sequence shown as SEQ ID 1 (ABQ78861) 
XX 

SQ Sequence 2766 BP; 654 A; 678 C; 761 G; 673 T; 0 U; 0 Other; 

Query Match 95.8%; Score 1784.6; DB 6; Length 2766; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I II I I 
Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGCAGAACAAT GAGT C CT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 ACAGGGCAGAACAAT GAGT C CT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT C CT G 180 

Qy 181 CCAATCTGGTACCCGG^VGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CT ATTGAAGTCAT CAC CT CT CAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I 
Db 301 T CTATT GAAGTCAT CAC CT CT CAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 360 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AC CAGC ACAACC ACT ATT C GGGT CT GGAAT GAAACT GT CT CCAACCT GAC C CTTAT GGC C 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 



Qy 

Db 



481 AT T GCT GGT GAT CT GGGAC CTT CTAC CAT TGT AGGGAGT GCAGC CTT CAACAT GTTCAT C 540 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

481 AT T GCT GGT GAT CT GGGAC CTT CTAC CAT T GT AGGGAGT GCAGCCTT CAACAT GT T CAT C 540 



Qy 541 AT C ATTGGCAT CT GT GT CT ACGTGAT C CCAGACGGAGAGACTC GCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 AT CATT GGCAT CT GT GT CT ACGT GAT C CCAGACGGAGAGACTC GCAAGAT CAAGCAT CT A 600 

Qy 601 C GAGT CTT CT T CAT CACC GCT GCTT GGAGT AT CTT T GCCT ACAT CT GGCT CT AT ATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 C GAGT CT T CTT CAT CACC GCT GCTT GGAGT AT CTTT GCCT ACAT CT GGCTCT ATATGAT T 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GCACAAAAAGT AC CGCACAGACAAAC AC CGAGGAATT AT CAT AGAGACAGAGGGT GAC 840 

I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AT GCACAAAAAGT AC CGCACAGACAAAC ACCGAGGAATT AT CAT AGAGACAGAGGGT GAC 840 

Qy 841 CAC C CTAAGGGCAT T GAGATGGAT GGGAAAAT GAT GAAT T C CCATTTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CAC C CTAAGGGCATT GAGATGGAT GGGAAAAT GAT GAAT T C CCATTTT CT AGAT GGGAAC 900 

Qy 901 CT GGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGTC C C GCAGAGAGAT GAT C CGGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CT GGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGT C CC GCAGAGAGAT GAT CCGGATT CT C 960 

Qy 961 AAGGAT CT GAAGCAAAAAC AC C C AGAGAAGGACTT AGATCAGCT GGT GGAGATGGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAAT 1020 

Qy 1021 TACT ATGCT CTTT CC CAC CAACAGAAGAGCCGCGC CTT CT ACC GT AT CCAAGCCACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TACT ATGCT CT TT CC CAC CAACAGAAGAGCCGCGC CT T CT ACC GT AT CCAAGCCACT C GT 1080 

Qy 1081 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1081 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGC C 1140 

Qy 1141 T CC AGCAT GAGC GAGGTGC ACACC GAT GAGCCT GAGGACTT TATTT CCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 T CC AGCAT GAGC GAGGTGCACACC GAT GAGCCT GAGGACTT TATTTCCAAGGT CTTCTT T 1200 

Qy 1201 GAC CCAT GTT CTT ACCAGT GC CT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

Qy 1261 AAAGGGGGAGACAT GT CAAAGACCAT GT AT GT GGACT ACAAAAC AGAGGAT GGT T CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 AAAGGGGGAGACAT GT CAAAGACCAT GTAT GT GGACT ACAAAACAGAGGAT GGT TCT GC C 1320 

Qy 1321 AAT GCAGGGGCT GACT AT GAGTT C AC AGAGGGCACGGT GGTT CT GAAGCCAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I 
Db 1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

Qy 1381 CAGAAGGAGTT CT CC GTGGGC AT AATT GAT GAC GAC AT TTTTGAGGAGGAT GAACACTT C 1440 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1381 CAGAAGGAGTT CT C CGT GGGCATAATT GAT GACGACATTTTT GAGGAGGAT GAACACTT C 1440 

Qy 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I II I I I I I I I I I I I I I I I I I 1 I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 T TT GTAAGGTT GAGCAAT GTC C GC AT AGAGGAGGAGCAGCCAGAGGAGGGGAT GC CT CC A 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GTTACCATCTTGGATGAT GACCAT GCAGGCATCTT CACTTTTGAATGTGATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1561 GTT AC CAT CT T GGATGAT GAC CAT GCAGGC AT CTT CACT TTT GAAT GT GAT ACTATT CAT 1620 

Qy 1621 GT CAGT GAGAGT AT T GGT GTT AT GGAGGT CAAGGTTCT GCGGAC AT CAGGT GC CC GGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

Qy 1681 ACAGT CAT C GT C C CCTT T AGGAC AGT AGAAGGGACAGCCAAGGGT GGC GGT GAGGACTTT 1740 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1681 ACAGT CAT C GT C C C CTT T AGGACAGT AGAAGGGACAGC CAAGGGT GGC GGT GAGGACTT T 1740 

Qy 1741 GAAGACACATAT GGGGAGTTGGAATTCAAGAATGATGAAACT GTAT GTGACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1741 GAAGACACATAT GGGGAGT T GGAAT T CAAGAAT GAT GAAAC T GT GAAAAC C AT AAG 1796 

Qy 1801 GCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I I I I I I I I II I I I 

Db 1797 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 1837 



RESULT 4 
ABQ78866 

ID ABQ78866 standard; cDNA; 2769 BP. 
XX 

AC ABQ78866; 
XX 

DT 09-OCT-2002 (first entry) 
XX 



DE Human ion exchanger protein #1 cDNA A/G+GCA mutant. 
XX 

KW Human; ion exchanger protein; NHIEP; nootropic; cytostatic; gene therapy; 
KW antiarthritic; virucide; chemotherapeutic; cancer; arthritis; antiviral; 
KW gene; ss; mutant. 
XX 

OS Homo sapiens . 
OS Synthetic. 
XX 

FH Key Location/Qualifiers 

FT mutation replace ( 1889, A) 

FT /*tag= a 

FT mutation replace (2113 . .2115,-) 

FT /*tag= b 

XX 

PN WO200259316-A2. 
XX 



PD 01-AUG-2002. 
XX 

PF 22-JAN-2002; 2002WO-US001817 . 
XX 

PR 23-JAN-2001; 2001US-0263384P . 
XX 

PA (LEXI-) LEXICON GENETICS INC. 
XX 

PI Friddle CJ, Hilbun E; 
XX 

DR WPI; 2002-599791/64. 
XX 

PT Novel polynucleotides encoding human ion exchanger proteins that are 

PT structurally related to mammalian sodium- calcium exchanger proteins , 

PT useful for drug screening, diagnosis and in gene therapy of biological 

PT disorders. 
XX 

PS Disclosure; Page; 42pp; English. 
XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP) , 

CC that shares structural similarity with mammalian sodium- calcium exchanger 

CC proteins , and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 

CC or to therapeutically augment the efficacy of chemotherapeutic agents 

CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC sequence represents a mutant form of a NHIEP of the invention. Note: The 

CC present sequence is not shown in the specification but is derived from 

CC. the human NHIEP sequence shown as SEQ ID 1 (ABQ78861) 
XX 

SQ Sequence 2769 BP; 655 A; 679 C; 762 G; 673 T; 0 U; 0 Other; 

Query Match 95.8%; Score 1784.6; DB 6; Length 2769; 
Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 1 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGC AGAACAAT GAGT CCT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 ACAGGGC AGAACAAT GAGT CCT GT T C AGGGTCAT C GGACT GCAAGGAGGGT GT CAT CCT G 180 

Qy 181 C CAAT CTGGT AC C C GGAGAAC CCT T C C CTT GGGGACAAGATT GCC AGGGT CATT GT CT AT 240 



Db 



181 




240 



Qy 



241 



TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 



300 



Db 



241 




300 



301 T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAA 360 

361 ACCAGCACAACC ACT ATT CGGGT CT GGAAT GAAACTGT CT CCAACCT GAC CCTTAT GGCC 420 

I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II 
361 ACCAGCACAACC ACT AT T C GGGT CT GGAAT GAAACTGT CT C CAACCT GAC CCTTAT GGC C 420 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

481 ATT GCT GGT GAT CT GGGAC CT T CT ACCATT GT AGGGAGT GCAGCCTT CAACAT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

481 ATT GCT GGT GAT CT GG GAC CT T CT ACCAT T GT AGGGAGT GCAGCCTT CAACAT GT T CAT C 540 

541 AT CAT T GGCAT CT GT GT CT AC GTGAT CCC AGACGGAGAGACT C GCAAGAT CAAGCAT CTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 AT CAT T GGCAT CT GT GT CT AC GT GAT CCC AGACGGAGAGACT C GCAAGAT CAAGCAT CTA 600 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

781 AT GC ACAAAAAGT AC C GC ACAGACAAAC AC C GAGGAAT TAT C AT AGAGACAGAGGGTGAC 840 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCAT AGAGACAGAGGGTGAC 84 0 

841 CAC C CTAAGGGC ATT GAGAT GGAT GGGAAAAT GAT GAATT CC C ATTT T CT AGAT GGGAAC 900 
. I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I fl I I I I I I I I I I I I I I I I I 
841 CACC CTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAAT T CC C ATTT T CT AGATGGGAAC 900 

901 CTGGT GC CC CT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GAT CC GGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CTGGT GCC C CT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GAT C C GGAT T CT C 960 

961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 
961 AAGGAT CT GAAGCAAAAAC AC C C AGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGCCAAT 1020 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

1081 AT GAT GACT GGT GC AGGCAAT AT C CT GAAGAAAC ATGCAGCAGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I 
1081 AT GAT GACT GGTGCAGG CAAT AT C CT GAAGAAACATGC AGCAGAACAAGCCAAGAAGGC C 1140 

1141 T CCAGCAT GAGCGAGGT GCAC ACC GAT GAGC CT GAGGACTTT AT TT C CAAGGT CTT CTTT 1200 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 T C CAGCAT GAGC GAGGT GCACACC GAT GAGCCT GAGGACTTTATTT C CAAGGT CTT CTT T 



1200 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1201 GACC CATGTT CTT ACCAGT GCCT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 GACC CATGTT CTT ACCAGT GCCT GGAGAACTGT GGGGCT GTACTCCT GACAGT GGT GAGG 1260 

1261 AAAGGGGGAGAC AT GT CAAAGACCAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

1261 AAAGGGGGAGACAT GT CAAAGACCAT GTAT GT GGACT ACAAAACAGAGGATGGTT CTGCC 1320 

1321 AAT GCAGGGGCTGACT AT GAGTT CACAGAGGGCACGGT GGTT CT GAAGCCAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 AAT GC AGGGGCT GACT AT GAGTTCAC AGAGGGC ACGGT GGTT CT GAAGCCAGGAGAGAC C 1380 

1381 CAGAAGGAGTT CT C CGT GGGCATAATT GAT GACGACAT T TTT GAGGAGGAT GAAC ACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I i I I I I I I 
1381 CAGAAGGAGTT CT C CGT GGGCATAATT GAT GACGACATTTTTGAGGAGGATGAACACTT C 1440 

1441 TTT GT AAGGTT GAGCAAT GTCCGCAT AGAGGAGGAGC AGC CAGAGGAGGGGAT GCCT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I 
1441 TTT GT AAGGTT GAGCAAT GT C CGCAT AGAGGAGGAGC AGC CAGAGGAGGGGAT GC CT CCA 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

1561 GTT AC C AT CTT GGATGAT GACCAT GCAGGC AT CTT CACT TTT GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 GTTAC CAT CTT GGATGAT GACCAT GCAGGC AT CTT CACTTTTGAATGTGATACTATTCAT 1620 

1621 GTCAGT GAGAGT ATTGGT GT TAT GGAGGT CAAGGT TCT GCGGACAT CAGGT GCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 GT CAGT GAGAGT ATTGGT GTT AT GGAGGT CAAGGT TCT GCGGACAT CAGGT GCCCGGGGT 1680 

1681 ACAGT CAT CGT CC C CT TT AGGACAGT AGAAGGGAC AGC CAAGGGT GGC GGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I II 

1681 ACAGT CAT CGT CC C CTT T AGGACAGT AGAAGGGAC AGC CAAGGGT GGC GGT GAGGACTTT 174 0 

1741 GAAGACACATAT GGGGAGTTGGAATTCAAGAATGATGAAACTGTATGT GACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

1741 GAAGACACATAT GGGGAGT TGGAATT CAAGAAT GAT GAAAC T GT GAAAACCATAAG 1796 

1801 GCT GACTAT GGAAGAAGAGGAGGCCAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I II I 

1797 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 1837 



RESULT 5 
ABQ78865 

ID ABQ78865 standard; cDNA; 2769 BP. 
XX 

AC ABQ78865; 
XX 

DT 09-OCT-2002 (first entry) 
XX 

DE Human ion exchanger protein #1 cDNA GCA mutant. 



XX 

KW Human; ion exchanger protein; NHIEP; nootropic; cytostatic; gene therapy; 

KW antiarthritic; virucide; chemotherapeutic; cancer; arthritis; antiviral; 

KW gene; ss; mutant . 
XX 

OS Homo sapiens. 

OS Synthetic. 
XX 

FH Key Location/Qualif iers 

FT mutation replace ( 2113 . .2115,-) 

FT /*tag= a 
XX 

PN WO200259316-A2. 
XX 

PD 01-AUG-2002. 
XX 

PF 22-JAN-2002; 2002WO-US001817 . 
XX 

PR 23-JAN-2001; 2001US-0263384P . 
XX 

PA (LEXI-) LEXICON GENETICS INC. 
XX 

PI Friddle CJ, Hilbun E; 
XX 

DR WPI; 2002-599791/64. 
XX 

PT Novel polynucleotides encoding human ion exchanger proteins that are 

PT structurally related to mammalian s odium- calcium exchanger proteins , 

PT useful for drug screening, diagnosis and in gene therapy of biological 

PT disorders. 
XX 

PS Disclosure; Page; 42pp; English. 
XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP) , 

CC that shares structural similarity with mammalian sodium- calcium exchanger 

CC proteins, and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 

CC or to therapeutically augment the efficacy of chemotherapeutic agents 

CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC sequence represents a mutant form of a NHIEP of the invention. Note: The 

CC present sequence is not shown in the specification but is derived from 

CC the human NHIEP sequence shown as SEQ ID 1 (ABQ78861) 
XX 

SQ Sequence 2769 BP; 656 A; 679 C; 761 G; 673 T; 0 U; 0 Other; 

Query Match 95.8%; Score 1784.6; DB 6; Length 2769; 
Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 1 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 



121 ACAGGGCAGAACAAT GAGT CCTGTTCAGGGTCATCGGACTGCAAGGAGGGT GTCATCCTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 ACAGGGCAGAACAAT GAGT CCT GTT C AGGGTCAT CGGACT GCAAGGAGGGT GTCAT CCTG 180 

181 C CAAT CT GGT AC CC GGAGAAC CCT T C C CTT GGGGACAAGATT GCCAGGGT CATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

301 T CTAT T GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC C CAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 TCTATT GAAGT CAT C ACCT CT CAAGAGAGGGAGGT GACAATTAAGAAAC C CAATGGAGAA 360 

361 AC C AGC ACAAC CACT ATT C GGGTCT GGAAT GAAACT GT CT C CAACCT GAC CCTT AT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 AC C AGC ACAAC CACT ATT C GGGTCT GGAAT GAAACT GT CT CCAACCT GAC CCTTAT GGC C 420 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

541 AT CATT GGCAT CT GT GT CT AC GT GAT C C C AGACGGAGAGACTC GCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 AT C ATT G GCAT CT GT GT CT ACGTGAT C CC AGACGGAGAGACTC GCAAGAT CAAGCAT CT A 600 

601 C GAGT CT T CTT CAT CACC GCT GCTT GGAGT AT CTT T GC CT AC AT CT GGCT CT AT ATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I 
601 C GAGT CT T CTT CAT CACC GCT GCTT GGAGT AT CTT T GCCT ACAT CT GGCT CTAT AT GAT T 660 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

721 TT T C CAGT GT GT GT C CTT CT GGCCT GGGT GGCAGATAAACGACT GCT CTT CT ACAAAT AC 780 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCT CTT CT ACAAAT AC 780 

781 AT GC ACAAAAAGT AC C GCACAGACAAAC AC CGAGGAATT AT CAT AGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
781 AT GC ACAAAAAGT AC C GCACAGACAAAC AC CGAGGAAT TAT CAT AGAGAC AGAGGGT GAC 840 

841 CACCCTAAGGGCATT GAGATGGAT GGGAAAAT GAT GAATT CCCATTTT CT AGAT GGGAAC 900 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 CACCCTAAGGGCATT GAGATGGATGGGAAAAT GAT GAATTCCCATTTT CTAGAT GGGAAC 900 

901 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CCGGATTCTC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CCGGATTCT C 960 



Qy 961 AAGGAT CTGAAGCAAAAAC AC CCAGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I 
Db 961 AAGGAT CT GAAGCAAAAACAC CCAGAGAAGGACTT AGAT CAGCT GGT GGAGATGGC CAAT 1020 



Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I 

Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

Qy 1081 AT GAT GACT GGT GCAGGCAAT ATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1081 AT GAT GACT GGTGCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

Qy 1141 T C CAGC AT GAGCGAGGT GCAC ACCGAT GAGC CTGAGGACTTT ATT T CCAAGGTCTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 T CCAGC AT GAGCGAGGT GCAC AC CGAT GAGC CTGAGGACTTTATT T CCAAGGT CTT CTTT 1200 

Qy 12 01 GACC C AT GTT CTT AC CAGT GC CT GGAGAACT GTGGGGCT GT ACT CCT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1201 GACC CAT GTT CTTAC CAGT GCCT GGAGAACT GTGGGGCT GT ACT CCT GACAGT GGT GAGG 1260 

Qy 1261 AAAGGGGGAGACATGT CAAAGACCAT GT AT GTGGACT ACAAAACAGAGGAT GGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 AAAGGGGGAGACATGTCAAAGACCATGTATGTGGACTACAAAACAGAGGATGGTTCTGCC 1320 

Qy 1321 AAT GCAGGGGCT GACT AT GAGTTCACAGAGGGCAC GGT GGTT CT GAAGC CAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 AAT GCAGGGGCT GACT AT GAGTTCAC AGAGGGCACGGT GGTT CT GAAGCCAGGAGAGACC 1380 

Qy 1381 C AGAAGGAGTT CTC C GT GGGCATAATT GAT GACGAC ATTT TT GAGGAGGAT GAAC ACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 C AGAAGGAGT T CTC C GT GGGCATAATT GAT GACGACATTT TT GAGGAGGAT GAAC ACTT C 1440 

Qy 1441 TTTGTAAGGT T GAGCAATGT C C GCAT AGAGGAGGAGC AGC CAGAGGAGGGGAT GC CT C C A 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1441 TT TGTAAGGT T GAGCAATGT C C GCAT AGAGGAGGAGC AGC CAGAGGAGGGGAT GCCT CCA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GTTACCATCTTGGATGATGACCATGCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 GTT AC C ATCTT GGAT GAT GAC CAT GC AGGC AT CTT CACT TT T GAAT GT GAT ACT ATT CAT 1620 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 GT CAGT GAGAGT AT T GGT GTT ATGGAGGT CAAGGT T CT GC GGACAT CAGGT GC C CGGGGT 1680 

Qy 1681 AC AGT CATC GT C CC CT TTAGGACAGT AGAAGGGAC AGC CAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 ACAGT CATCGT CCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGT GAGGACTTT 1740 

Qy 1741 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT AT GT GACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1741 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAAC T GT GAAAAC C AT AAG 1796 



Qy 

Db 



1801 GCTGACTATGGAAGAAGAGGAGGCCAAGAGGATAGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

1797 GGTTAAAATAGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGA 1837 



RESULT 6 
ADH42314 

ID ADH42314 standard; DNA; 2778 BP. 
XX 

AC ADH42314; 
XX 

DT 25-MAR-2004 (first entry) 
XX 

DE Novel human nucleic acid NOV55g. 
XX 

KW ds; gene; cardiovascular; antiarteriosclerotic; hypotensive; cytostatic; 

KW anorectic; antidiabetic; immunosuppressive; anti-HIV; neuroprotective; 

KW nootropic; antiparkinsonian; antiasthmatic; antiinf ertility; 

KW cardiomyopathy; atherosclerosis; hypertension; cancer; obesity; diabetes; 

KW AIDS; multiple sclerosis; graf t-versus-host disease; Alzheimer's disease; 

KW Parkinson's disease; asthma; fertility disorder; chromosome mapping; 

KW tissue typing; preventive medicine; pharmacogenomic; vaccine, 

XX 

OS Homo sapiens. 
XX 

PN WO2003102159-A2. 
XX 



PD 


11- 


DEC- 


2003. 




XX 












PF 


04- 


JUN- 


2003; 2003WO- 


US017573. 


XX 












PR 


04- 


JUN- 


2002, 


• 2002US- 


0385490P. 


PR 


04- 


JUN- 


2002, 


• 2002US- 


0385615P. 


PR 


04- 


JUN- 


2002, 


• 2002US- 


0385755P. 


PR 


05- 


JUN- 


2002, 


• 2002US- 


0386041P. 


PR 


06- 


JUN- 


2002, 


• 2002US- 


0386355P. 


PR 


06- 


JUN- 


2002, 


• 2002US- 


0386357P. 


PR 


06- 


JUN- 


2002, 


• 2002US- 


0386447P. 


PR 


06- 


JUN- 


2002, 


• 2002US- 


0386459P. 


PR 


06- 


JUN- 


2002, 


• 2002US- 


0386465P. 


PR 


06- 


JUN- 


2002, 


i 2002US- 


0386864P. 


PR 


07- 


JUN- 


2002, 


; 2002US- 


0386701P. 


PR 


07- 


JUN- 


2002, 


• 2002US- 


0386796P. 


PR 


07- 


JUN- 


2002, 


• 2002US- 


0386931P. 


PR 


07- 


JUN- 


2002, 


• 2002US- 


0387078P. 


PR 


.07- 


JUN- 


•2002, 


; 2002US- 


0387081P. 


PR 


07- 


JUN- 


•2002, 


i 2002US- 


0387083P. 


PR 


10- 


JUN- 


•2002, 


! 2002US- 


0387429P. 


PR 


10- 


JUN- 


•2002, 


? 2002US- 


0387540P. 


PR 


10- 


JUN- 


•2002, 


? 2002US- 


0387866P. 


PR 


11- 


JUN- 


■2002, 


\ 2002US- 


0387606P. 


PR 


11- 


JUN- 


•2002, 


; 2002US- 


0387610P. 


PR 


11- 


JUN- 


-2002, 


; 2002US- 


0387659P. 


PR 


11- 


JUN- 


■2002, 


; 2002US- 


0387668P. 


PR 


11- 


JUN- 


-2002, 


; 2002US- 


0387696P. 


PR 


11- 


JUN- 


•2002, 


; 2002US- 


0387859P. 


PR 


12- 


JUN- 


•2002, 


? 2002US- 


0387934P. 



PR 


12 


-JUN- 


•2002 


; 2002US- 


0387960P. 


PR 


12 


-JUN- 


-2002 


? 2002US- 


0388022P. 


PR 


12 


-JUN- 


•2002 


; 2002US- 


0388096P. 


PR 


12 


-JUN- 


•2002 


; 2002US- 


0388432P. 


PR 


12 


-JUN- 


2002 


; 2002US- 


0388479P. 


PR 


13 


-JUN- 


2002 


; 2002US- 


0389123P. 


PR 


14 


-JUN- 


2002 


? 2002US- 


0389120P. 


PR 


14 


-JUN- 


2002 


; 2002US- 


0389146P. 


PR 


17 
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XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, cardiomyopathy, 

PT atherosclerosis or diabetes, in chromosome mapping, tissue typing or in 

PT pharmacogenomics . 

XX 

PS Claim 20; SEQ ID NO 867; 1503pp; English. 
XX 

CC The invention relates to 566 new isolated human polypeptides and their 



CC encoding genes , sequences that are at least 95% identical to these or 

CC sequences comprising one or more conservative substitutions in these. The 

CC polypeptide, polynucleotide and antibodies against the polypeptides are 

CC useful in diagnosing, treating or preventing NOVX-associated disorders, 

CC e.g. cardiomyopathy, atherosclerosis, hypertension, cancer, obesity, 

CC diabetes, AIDS, multiple sclerosis, graf t-versus-host disease, 

CC Alzheimer's disease, Parkinson's disease, asthma, or fertility disorders. 



CC The nucleic acids are further used as hybridization probes, in chromosome 

CC mapping, tissue typing, preventive medicine, and pharmacogenomics . The 

CC polypeptides are also useful as vaccines. This sequence represents an 

CC example of the nucleic acid sequence of the invention. 
XX 

SQ Sequence 2778 BP; 656 A; 684 C; 764 G; 674 T; 0 U; 0 Other; 

Query Match 95.8%; Score 1784.6; DB 12; Length 2778; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 10 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 69 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 70 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 129 

Qy 121 ACAGGGCAGAACAATGAGTCCTGTTCAGGGT CATCGGACT GCAAGGAGGGT GT CATCCTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 130 ACAGGGCAGAACAATGAGTCCTGTTCAGGGT CATCGGACT GCAAGGAGGGT GT CATCCTG 189 

Qy 181 C CAAT CT GGT AC C CGGAGAAC C CTT C C CT T GGGGACAAGATT GCCAGGGT CAT T GTCT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I 
Db 190 C CAAT CT GGT AC C CGGAGAAC C CTT C C CTT GGGGACAAGATT GC CAGGGT CATT GT CTAT 249 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 250 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 309 

Qy 301 TCTATTGAAGTCATCACCTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 360 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 310 TCTATT GAAGTCATCACCTCT CAAGAGAGGGAGGTGACAATTAAGAAACCCAAT GGAGAA 369 

Qy 361 ACCAGC ACAAC CACT ATT C GGGT CT GGAAT GAAACT GT CT CCAACCTGACC CT TATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 370 AC CAGC ACAAC CACT ATT C GGGT CT GGAAT GAAACT GT CT CCAAC CT GACC CTT AT GGCC 429 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 489 

Qy 4 81 ATT GCT GGT GAT CT GGGAC CTT CT AC CATT GT AGGGAGT GCAGCCTT CAAC AT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 490 ATT GCT GGT GAT CT GGGAC CTT CT AC CATT GT AGGGAGT GC AGC CTT CAACAT GTT CAT C 549 



Qy 

Db 



541 ATCATTGGCATCT GTGTCT ACGT GATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
550 ATCATT GGCATCT GT GT CT AC GT GAT CC CAGACGGAGAGACT CGCAAGAT CAAGCAT CT A 609 



601 C GAGT CTT CTT CAT CACCGCT GCTT GGAGT AT CTTT GC CT ACAT CT GGCTCT AT ATGAT T 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

610 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 669 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

67 0 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 729 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I II I I I I I II I I 

730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 789 

781 AT GC ACAAAAAGT AC CGCACAGACAAACACCGAGGAATT AT C AT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

7 90 AT GC ACAAAAAGT AC CGCACAGACAAACACCGAGGAATT AT CAT AGAGACAGAGGGT GAC 849 

841 CAC C CTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT CCC ATTTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

850 CAC C CTAAGGGCAT T GAGATGGAT GGGAAAAT GAT GAAT T C CC ATTTT CT AGAT GGGAAC 909 

901 CT GGT GCCC CT GGAAGGGAAGGAAGT GGAT GAGTC C C GCAGAGAGAT GAT CC GGATTCT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

910 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CC GGATTCT C 969 

961 AAGGAT CT GAAGCAAAAAC AC CC AGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I 

970 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTT AGAT CAGCTGGT GGAGATGGCCAAT 1029 

1021 TACT AT GCT CTTT C CC ACCAACAGAAGAGCCGC GC CTT CT ACC GT AT CCAAGCCACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1030 TACT AT GCTCTTTCC CAC CAACAGAAGAGCCGC GC CTT CTACCGT AT CCAAGCCACT C GT 1089 

1081 ATGATGACTGGTGCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1090 AT GAT GACTGGT GC AGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 114 9 

1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1150 T C CAGCAT GAGCGAGGT GCACACC GAT GAGCCT GAGGACT T TAT TT CCAAGGT CTTCTTT 1209 

1201 GAC CC AT GTT CT T AC CAGT GC CTGGAGAACT GT GGGGCT GT ACT CCT GACAGT GGTGAGG 1260 

I II I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1210 GACCCAT GTT CTTAC CAGT GCCTGGAGAACTGT GGGGCTGTACT CCT GACAGTGGTGAGG 1269 

1261 AAAGGGGGAGACAT GT CAAAGACC AT GT AT GT GGACTACAAAAC AGAGGAT GGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1270 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACTACAAAAC AGAGGAT GGTT CT GC C 1329 

1321 AAT GC AGGGGCTGACT AT GAGTT CACAGAGGGC AC GGTGGT T CT GAAGC C AGGAGAGACC 1380 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1330 AAT GCAGGGGCT GAC TAT GAGT T CACAGAGGGC AC GGTGGT TCT GAAGC C AGGAGAGACC 1389 

1381 CAGAAGGAGTT CTCCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

1390 CAGAAGGAGT T CT C C GT GGGC ATAATT GAT GACGACATTTTTGAGGAGGAT GAACACTT C 1449 



Qy 1441 TTT GTAAGGTT GAGCAAT GT C CGCAT AGAGGAGGAGC AGCCAGAGGAGGGGATGCCT CCA 1500 

I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1450 TTT GTAAGGTT GAGCAAT GTCC GCAT AGAGGAGGAGC AGCCAGAGGAGGGGAT GCCTCCA 1509 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db ■ 1510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1569 

Qy 1561 GTT AC CAT CT T GGAT GAT GAC CAT GCAGGCAT CTT CACTTT T GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1570 GTT AC CAT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACTTT TGAAT GT GAT ACT ATT CAT 1629 

Qy 1621 GT CAGTGAGAGT ATT GGT GTT AT GGAGGT CAAGGTT CT GCGGACAT CAGGT GCCC GGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1630 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1689 

Qy 1681 ACAGT CAT C GT CC CCT TT AGGAC AGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1690 ACAGT CAT CGT CC CCT TT AGGAC AGT AGAAGGGACAGC CAAGGGT GGCGGT GAGGACTTT 1749 

Qy 1741 GAAGACACAT AT GGGGAGTTGGAAT T CAAGAAT GAT GAAACTGT AT GT GACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1750 GAAGACACAT AT GGGGAGTT GGAAT T CAAGAAT GAT GAAAC TGTGAAAACCATAAG 1805 

Qy 1801 GCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

Db 1806 GGT TAAAATAGT AGAT GAGGAGGAAT ACGAAAGGCAAGAGA 1846 
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DR WPI; 2004-053467/05. 
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XX 



PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, cardiomyopathy, 

PT atherosclerosis or diabetes,, in chromosome mapping, tissue typing or in 

PT pharmacogenomics . 



XX 

PS Claim 20; SEQ ID NO 859; 1503pp; English. 
XX 

CC The invention relates to 566 new isolated human polypeptides and their 

CC encoding genes, sequences that are at least 95% identical to these or 

CC sequences comprising one or more conservative substitutions in these. The 

CC polypeptide, polynucleotide and antibodies against the polypeptides are 



CC useful in diagnosing, treating or preventing NOVX-associated disorders, 

CC e.g. cardiomyopathy, atherosclerosis , hypertension, cancer, obesity, 

CC diabetes, AIDS, multiple sclerosis, graf t-versus-host disease, 

CC Alzheimer's disease, Parkinson's disease, asthma, or fertility disorders. 



CC The nucleic acids are further used as hybridization probes, in chromosome 

CC mapping, tissue typing, preventive medicine, and pharmacogenomics. The 

CC polypeptides are also useful as vaccines. This sequence represents an 

CC example of the nucleic acid sequence of the invention. 
XX 

SQ Sequence 2778 BP; 656 A; 684 C; 764 G; 674 T; 0 U; 0 Other; 

Query Match 95.8%; Score 1784.6; DB 12; Length 2778; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 1 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 69 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 70 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 129 

Qy 121 ACAGGGCAGAACAATGAGT CCT GTT CAGGGTCAT C GGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II II I I I I I I I II I 
Db 130 ACAGGGCAGAACAATGAGT CCT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GTCAT CCTG 189 

Qy 181 C CAAT CT GGT AC C C GGAGAAC C CTT C C CT T GGGGACAAGATT GC CAGGGT CATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 190 C CAAT CTGGTAC C C GGAGAAC C CTT C C CT T GGGGACAAGATTGCCAGGGT CATT GT CT AT 249 



Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 250 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 309 

Qy 301 T CT AT TGAAGT CATCACCT CT C AAGAGAGGGAGGT GACAAT TAAGAAAC C CAAT GGAGAA 360 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 310 TCTATTGAAGT CAT CACCTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 369 

Qy 361 AC CAGCACAACCACT ATT C GGGTCT GGAATGAAACT GT CT CCAACCT GACCCTT ATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 370 AC CAGCACAACCACT ATT C GGGT CT GGAAT GAAACT GT CT CCAACCT GACCCTT ATGGCC 429 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 489 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 490 ATT GCT GGTGAT CT GGGACCT T CT ACCATT GT AGGGAGT GCAGC CTT CAAC ATGTTCAT C 549 

Qy 541 AT CATT GGCAT CT GT GT CT ACGT GATC C CAGAC GGAGAGACTC GCAAGAT CAAGCAT CT A 600 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 550 AT CATT GGCAT CT GT GT CT ACGT GAT C CC AGACGGAGAGACT C GCAAGAT CAAGCAT CTA 609 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 610 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 669 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 729 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 789 

Qy 781 AT GC ACAAAAAGT ACC GCACAGACAAACACCGAGGAATT AT CAT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 790 AT GC ACAAAAAGT AC CGCACAGACAAACACCGAGGAATT AT CAT AGAGACAGAGGGT GAC 849 

Qy 841 CACCCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT CCC ATTTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 

Db 850 CACCCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT CCCATTTT CT AGATGGGAAC 909 

Qy 901 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGTCC C GCAGAGAGAT GAT C CGGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 910 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT C CC GCAGAGAGAT GAT C CGGATT CT C 969 

Qy 961 AAGGATCT GAAGCAAAAACAC CCAGAGAAGGACTT AGAT CAGCT GGT GGAGATGGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 970 AAGGATCT GAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGT GGAGATGGCCAAT 1029 

Qy 1021 TACT AT GCT CTT T C C C ACCAAC AGAAGAGC CGCGCCTT CT ACC GT AT C CAAGCCACT CGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1030 TACT AT GCTCT TT C C C ACCAAC AGAAGAGC CGCGCCTT CT ACC GTAT C CAAGCCACT CGT 1089 



Qy 1081 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1090 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1149 

Qy 1141 T C C AGCAT GAGCGAGGT GCAC ACCGAT GAGC CT GAGGACTTT ATTT CCAAGGT CTT CTTT 1200 

I I I I I II 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1150 T C CAGCAT GAGCGAGGT GCACAC CGAT GAGC CT GAGGACT TT ATTTC C AAGGT CT T CTTT 1209 

Qy 1201 GAC CCATGTTCTT AC C AGT GC CT GGAGAACT GT GGGGCT GT ACTCCT GAC AGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1210 GACCCATGTTCTT AC CAGTGC CT GGAGAACT GT GGGGCT GTACTCCT GACAGTGGT GAGG 1269 

Qy 1261 AAAGGGGGAGACAT GTCAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 1320 

I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1270 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGTT CT GC C 1329 

Qy 1321 AATGCAGGGGCTGACTAT GAGTT CACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1330 AAT GCAGGGGCT GACTAT GAGT T C ACAGAGGGC ACGGTGGTT CTGAAGC CAGGAGAGACC 1389 

Qy 1381 CAGAAGGAGTT CTC C GTGGGCAT AATT GAT GACGACATTT TT GAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1390 CAGAAGGAGTT CTC C GT GGGCAT AATT GAT GAC GACATTT TT GAGGAGGAT GAACACTT C 1449 

Qy 1441 TTT GTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCT CCA 1500 

I I I I I I I I I I I I II I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1450 TTT GTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCT CCA 1509 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1569 

Qy 1561 GTT AC CAT CTT GGAT GAT GACCAT GC AGGCATCTTCACTTTT GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1570 GTTACCAT CTT GGATGATGACCAT GCAGGCATCTTCACTTTTGAATGTGAT ACTATTCAT 1629 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1630 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1689 

Qy 1681 ACAGT CAT CGT CCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGT GAGGACTTT 1740 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1690 ACAGT CAT CGT C CC CTT TAGGAC AGT AGAAGGGACAGCCAAGGGT GGC GGT GAGGACTTT 174 9 

Qy 1741 GAAGAC ACATAT GGGGAGTT GGAAT T CAAGAAT GAT GAAACT GTAT GT GACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1750 GAAGACACATAT GGGGAGTT GGAATT CAAGAAT GAT GAAAC T GT G AAAAC C AT AAG 1805 

Qy 1801 GCT GACTAT GGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

Db 1806 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 1846 



RESULT 8 
ABQ78863 

ID ABQ78863 standard; cDNA; 3812 BP. 
XX 



AC ABQ78863; 
XX 

DT 09-OCT-2002 (first entry) 
XX 

DE Human ion exchanger protein cDNA #3. 
XX 

KW Human; ion exchanger protein; NHIEP; nootropic; cytostatic; gene therapy; 

KW antiarthritic; virucide; chemotherapeutic; cancer; arthritis; antiviral; 

KW gene; ss; chromosome 14. 
XX 

OS Homo sapiens. 
XX 

PN WO200259316-A2. 
XX 

PD 01-AUG-2002. 
XX 

PF 22-JAN-2002; 2002WO-US001817 . 
XX 

PR 23-JAN-2001; 2001US-0263384P. 
XX 

PA (LEXI-) LEXICON GENETICS INC. 
XX 

PI Friddle CJ, Hilbun E; 
XX 

DR WPI; 2002-599791/64. 
XX 

PT Novel polynucleotides encoding human ion exchanger proteins that are 

PT structurally related to mammalian sodium- calcium exchanger proteins, 

PT useful for drug screening, diagnosis and in gene therapy of biological 

PT disorders. 
XX 

PS Disclosure; Page 41-42; 42pp; English. 
XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP) , 

CC that shares structural similarity with mammalian sodium- calcium exchanger 

CC proteins, and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 

CC or to therapeutically augment the efficacy of chemotherapeutic agents 

CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC sequence encodes a NHIEP of the invention, with regions of flanking 

CC sequence 

XX 

SQ Sequence 3812 BP; 860 A; 1059 C; 1041 G; 852 T; 0 U; 0 Other; 

Query Match 95.8%; Score 1784.6; DB 6; Length 3812; 
Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 1 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 618 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 677 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 678 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 737 



121 ACAGGGCAGAACAATGAGT CCT GT T CAGGGT C AT CGGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
738 AC AGGGCAGAACAAT GAGT CCT GTTCAGGGT CAT CGGACT GCAAGGAGGGTGT CATC CT G 797 

181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
798 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 857 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I 
858 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 917 

301 T CT ATT GAAGTCAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAA 360 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
918 T CT AT T GAAGT CAT C ACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAA 977 

361 ACCAGCACAACCACT ATT CGGGTCT GGAAT GAAACT GT CT C CAAC CT GAC C CTTATGGCC 420 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
978 AC CAGCACAACCACT ATT CGGGT CT GGAAT GAAACT GT CT C CAAC CT GAC CCTT AT GGC C 1037 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1038 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1097 

481 AT T GCT GGT GAT CTGGGACCTT CT ACCATT GT AGGGAGT GC AGC CTT CAAC AT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1098 ATT GCT GGT GAT CT GGGAC CTT CT AC CAT T GT AGGGAGT GCAGCCTT CAACAT GTT CAT C 1157 

541 ATCATT GGCATCT GT GTCT ACGTGATCCCAGACGGAGAGACT CGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1158 AT C ATT GGCATCT GT GTCT ACGTGATCC CAGACGGAGAGACT CGCAAGAT CAAGCAT CT A 1217 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1218 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1277 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1278 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1337 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
1338 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1397 

781 AT GCACAAAAAGT AC C GC ACAGACAAACAC CGAGGAATT AT CAT AGAGACAGAGGGT GAC 840 
I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1398 ATG C ACAAAAAGT AC C GC ACAGACAAACAC C GAGGAAT TAT CAT AGAGACAGAGGGT GAC 1457 

841 CACCCTAAGGGCATT GAGATGGATGGGAAAAT GAT GAATTCCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1458 CACCCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATTC CCAT TT T CT AGAT GGGAAC 1517 



901 CTGGT GC CC CTGGAAGGGAAGGAAGT GGAT GAGT C CC GC AGAGAGAT GAT CCGGATT CTC 960 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1518 CTGGT GCCCCTGGAAGGGAAGGAAGT GGAT GAGT CCCGCAGAGAGAT GAT CCGGATT CT C 1577 



Qy 961 AAGGAT CT GAAGCAAAAACAC C CAGAGAAGGACTT AGATCAGCTGGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1578 AAGGAT CT GAAGCAAAAACAC C CAGAGAAGGACTT AGAT CAGCTGGTGGAGAT GGC CAAT 1637 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1638 T ACT AT GCT CT T T C CCACCAACAGAAGAGCCGCGCCTT CT AC C GTAT CCAAGC CACT C GT 1697 

Qy 1081 AT GAT GACT GGT GC AGGCAAT AT C CT GAAGAAACAT GC AGCAGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 
Db 1698 ATGAT GACT GGT GC AGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1757 

Qy 1141 T CC AGCAT GAGC GAGGT GC ACACC GAT GAGCCT GAGGACTT T ATTT CCAAGGT CTT CTTT 1200 

I I I I I II I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1758 T CC AGCAT GAGC GAGGT GCAC ACC GAT GAGCCT GAGGACTTT ATTT C CAAGGT CT T CTTT 1817 

Qy 1201 GAC C CAT GTT CTT ACCAGT GC CT GGAGAACTGT GGGGCT GT ACTCCT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1818 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1877 

Qy 1261 AAAGGGGGAGAC AT GT CAAAGACCAT GTAT GT GGACT ACAAAACAGAGGAT GGTT CTGCC 1320 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1878 AAAGGGGGAGAC AT GT CAAAGACCAT GTAT GT GGACT ACAAAACAGAGGAT GGTT CTGCC 1937 

Qy 1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1938 AAT G CAGGGGCT GACT AT GAGT TC ACAGAGGGCACGGT GGTT CTGAAGCCAGGAGAGACC 1997 

Qy 1381 CAGAAGGAGTT CTCCGTGGGCATAATTGATGACGACATTTTT GAGGAGGATGAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1998 CAGAAGGAGTT CT CCGT GGGCATAATT GAT GACGACAT TTTT GAGGAGGAT GAACACT T C 2057 

Qy 1441 T TT GTAAGGTT GAGCAAT GT C C GCAT AGAGGAGGAGCAGCC AGAGGAGGGGAT GCCT C CA 1500 

I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2058 TTT GTAAGGTT GAGCAAT GTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 2117 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 1 
Db 2118 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2177 

Qy 1561 GTT AC CAT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACTTTT GAAT GT GAT ACT ATTC AT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2178 GTT ACC AT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACT TTT GAAT GT GAT ACT ATTCAT 2237 

Qy 1621 GTCAGT GAGAGT AT TGGT GTT AT GGAGGT CAAGGTTCT GCGGACAT CAGGT GC CC GGGGT 1680 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I Ml I I I I I I I I 
Db 2238 GTCAGT GAGAGT AT TGGT GTT ATGGAGGT CAAGGTTCT GCGGACAT CAGGT GC CC GGGGT 2297 

Qy 1681 ACAGT CAT C GT C C CCT TT AGGACAGT AGAAGGGACAGCCAAGG GT GGCGGT GAGGACT TT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2298 ACAGT CAT C GT C CCCTTT AGGACAGTAGAAGGGAC AGC CAAGGGT GGC GGT GAGGACTT T 2357 

Qy 1741 GAAGAC ACATAT GGGGAGTT GGAATT CAAGAAT GATGAAACT GTAT GT GACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 2358 GAAGACACAT AT G GGGAGT T GGAATT CAAGAAT GATGAAAC TGT GAAAACCATAAG 2413 

Qy 1801 GCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGA 1841 



Ill 1 1 I 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 

Db 2414 GGTTAAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGA 2454 



RESULT 9 
ACC00414 

ID ACC00414 standard; cDNA; 2534 BP. 
XX 

AC ACC00414; 
XX 

DT 04-JUL-2003 (first entry) 
XX 

DE Human 69039 coding sequence. 
XX 

KW Human; 69039; neuroprotective; gene therapy; haematopoietic disorder; 

KW Na+/Ca2+ exchanger; ion transporter; neural tissue; 

KW neurological disorder; gene; ss. 
XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 343. .2130 

FT /*tag= a 

FT /product= "Human 69039" 

XX 

PN WO2003029410-A2. 
XX 

PD 10-APR-2003. 
XX 

PF 27-SEP-2002; 2002WO-US030817 . 
XX 

PR 28-SEP-2001; 2001US-0325737P . 
XX 

PA (MILL- ) MILLENIUM PHARM INC. 
XX 

PI Carroll JM; 
XX 

DR WPI; 2003-381617/36. 

DR P-PSDB; ABR40134. 
XX 

PT Identifying a nucleic acid molecule associated with a disorder for 

PT preparing a composition for treating hematopoietic or neurological 

PT disorder by detecting the presence of a nucleic acid molecule in the 

PT sample that is amplified. 
XX 

PS Claim 1; Page 109-110; 133pp; English. 
XX 

CC The present sequence is the coding sequence for human 69039 , a novel 

CC Na+/Ca2+ exchanger family member (ion transporter) . 69039 was shown to be 

CC expressed in human haematopoietic cells, e.g. CD34-expressing progenitor 

CC cells as well as in neural tissues, e.g. brain cortex and hypothalamus. 

CC 69039 may therefore be used for preparing a composition for treating 

CC haematopoietic or neurological disorder 

XX 

SQ Sequence 2534 BP; 602 A; 595 C; 644 G; 693 T; 0 U; 0 Other; 



Query Match 



95.8%; Score 1784.4; DB 10; Length 2534; 



Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 343 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 402 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 403 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 462 

Qy 121 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGTCAT CGGACT GCAAGGAGGGT GTCATC CT G 180 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I 
Db 463 ACAGGGCAGAACAAT GAGT CCT GT T CAGGGTCAT CGGACT GCAAGGAGGGT GTCATC CT G 522 

Qy 181 CCAAT CT GGT AC C CGGAGAAC CCT T C C CT T GGGGACAAGATT GC CAGGGT CATT GTCT AT 24 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 523 CCAAT CT GGT AC C CGGAGAAC CCT T C C CTT GGGGACAAGATTGCCAGGGT CATT GTCT AT 582 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 583 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 642 

Qy 301 TCTATTGAAGTCAT CACCTCTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 643 TCT ATTGAAGT CAT CACCTCTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 702 

Qy 361 ACCAGCACAAC C ACT ATT C GGGT CT GGAAT GAAACT GT CT CCAACCT GACC CT T ATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 703 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 762 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 763 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 822 

Qy 481 AT T GCT GGTGATCT GGGACCT T CT AC CAT T GT AGGGAGT GC AGC CTT CAACAT GTTCAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 823 AT T GCT GGTGAT CT GGGACCT T CT AC CATT GT AGGGAGT GCAGC CTT CAACATGTTCAT C 882 

Qy 541 AT CATTGGCAT CT GT GTCT AC GT GAT C C CAGACGGAGAGACT C GCAAGAT CAAGCAT CTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 883 AT CATT GGCAT CT GT GT CT AC GT GAT C CCAGAC GGAGAGACT C GCAAGAT CAAGCAT CTA 942 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 943 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1002 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1003 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1062 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1063 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1122 

Qy 781 AT GCACAAAAAGT AC CGC ACAGACAAACACCGAGGAATT AT CAT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1123 AT GCACAAAAAGT AC C GCAC AGACAAACACC GAGGAATTAT CAT AGAGAC AGAGGGT GAC 1182 



841 CAC CCTAAGGGC ATT GAGAT GGAT GGGAAAAT GAT GAATT C CC ATTT T CT AGATGGGAAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1183 CAC CCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT CCCATTTTCT AGATGGGAAC 



901 



1243 



961 



CT GGT GC CC CT G GAAGGGAAGGAAGT GGAT GAGT CC CGCAGAGAGAT GAT CCGGATT CT C 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

CT GGT GC CC CT G GAAGGGAAGGAAGT GGAT GAGT C CCGCAGAGAGATGAT C C GGATT CTC 



900 



1242 



960 



1302 



AAGGAT CT GAAGCAAAAACAC C C AGAGAAGGACTT AGAT CAGCT GGTGGAGAT GGC CAAT 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1303 AAGGAT CT GAAGCAAAAACACC CAGAGAAGGACTT AGAT CAGCT GGTGGAGAT GGC CAAT 1362 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1363 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1422 

1081 AT GAT GACT GGT GC AGGCAAT ATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1423 AT GAT GACT GGT GC AGGCAAT ATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGC C 1482 

1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1483 T C CAGCAT GAGC GAGGT GCACACCGAT GAGC CT GAGGACTTTATTT CCAAGGT CTT CT TT 1542 

1201 GAC CCAT GTT CT T AC CAGT GC CT GGAGAACT GT G GGGCT GT ACT CCTGACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1543 GAC CCAT GTT CT T AC CAGT GC CT GGAGAACT GT GGGGCT GT ACT CCTGACAGT GGT GAGG 1602 

1261 AAAGGGGGAGACAT GTCAAAGACC AT GTATGT GGACT ACAAAACAGAGGAT GGTT CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1603 AAAGGGGGAGACAT GTCAAAGACC AT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 1662 

1321 AAT GCAGGGGCT GACTATGAGTTCACAGAGGGCACGGTGGTTCT GAAGCCAGGAGAGACC 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAT GCAGGGGCT GACTATGAGTTCACAGAGGGCACGGTGGTTCT GAAGCCAGGAGAGACC 



1663 



1722 



1381 CAGAAGGAGT TCT CC GT GGGCATAATT GAT GAC GACATT TTTGAGGAGGAT GAACACTTC 1440 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
CAGAAGGAGT T CT C C GT GGGCATAAT T GAT GAC GACATTTTTGAGGAGGAT GAACACTTC 1782 



1723 



1441 TTT GTAAGGT T GAGCAAT GT CCGCAT AGAGGAGGAGCAGC CAGAGGAGGGGAT GCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1783 T TT GTAAGGT TGAGCAAT GT CCGCAT AGAGGAGGAGCAGC CAGAGGAGGGGAT GCCT CCA 1842 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1843 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1902 

1561 GTT AC CAT CT TGGAT GATGAC C AT GC AGGCAT CTTC ACTTTTGAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1903 GTT AC CAT CTTGGAT GAT GAC C AT GCAGGCAT CT T C ACTTTTGAAT GT GAT ACTATT CAT 1962 

1621 GT CAGT GAGAGT ATT GGT GT T ATGGAGGT CAAGGTT CT GC GGAC AT CAGGT GC CCGGGGT 1680 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1963 GT CAGT GAGAGT ATT GGT GT T ATGGAGGT CAAGGTT CT GC GGACAT CAGGT GC CCGGGGT 2022 



Qy 1681 ACAGT CAT CGT C CCCTTT AGGACAGT AGAAGGGAC AGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2023 ACAGT CAT CGT CCC CT TT AGGACAGT AGAAGGGAC AGCCAAGGGTGGCGGT GAGGACT TT 2082 



Qy 1741 GAAGACACAT AT GGGGAGTTGGAAT T CAAGAAT GAT GAAACTGT AT 1786 

I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2083 GAAGACACAT ATGGGGAGTTGGAAT T CAAGAAT GAT GAAACTGT GT 2128 

RESULT 10 
ABA04756 

ID ABA04756 standard; cDNA; 2781 BP. 
XX 

AC ABA04756; 
XX 

DT 25-FEB-2002 (first entry) 
XX 

DE Human natrium (+) -calcium (2+) exchanger form 3 protein, HNCX3, cDNA. 
XX 

KW Human; Natrium( + ) -Calcium (2+) exchanger form 3; HNCX3; chromosome 14; 

KW cardiac failure; myocardial infarction; cardiac hypertrophy; arrhythmia; 

KW myocarditis; pulmonary hypertension; cardiotoxicity; cardiant; Vaccine; 

KW coronary heart disease; renal failure; ischaemic disorder; 

KW Antiarrhythmic; Vasotropic; Hypotensive; cardiovascular disorder; ss. 

XX 

OS Homo sapiens. 



XX 

FH Key Location/Qualifiers 

FT CDS 1. .2781 

FT /*tag= a 

FT /partial 

FT /product= "Human natrium(+) -calcium(2+) exchanger form 3 

FT protein, HNCX3" 

FT /note= "No stop codon given" 

XX 



PN WO200183744-A2. 
XX 

PD 08-NOV-2001. 
XX 

PF 30-APR-2001; 2001WO-EP004886 . 
XX 

PR 02-MAY-2000; 2000EP-00109080 . 
XX 

PA (MERE ) MERCK PATENT GMBH. 

XX_ 

PI Wilm C; 
XX 

DR WPI; 2002-041493/05. 

DR P-PSDB; AAM47745. 
XX 

PT New polypeptide, useful as vaccines for inducing immune response against 

PT diseases such as myocardial infarction, arrhythmia, ischemic disorders, 

PT renal disorders in mammal . 
XX 

PS Claim 4; Page 34-38; 41pp; English. 
XX 



CC The present sequence is the coding sequence for human Natrium (+) -Calcium 

CC (2+) exchanger form 3 (HNCX3) . The HNCX3 gene maps to human chromosome 

CC 14. HNCX3 and its coding sequence are useful for treating acute and 

CC chronic cardiac failure of different aetiologies , myocardial infarction, 

CC cardiac hypertrophy, arrhythmia, myocarditis, pulmonary hypertension, 

CC cardiotoxicity (e.g. induced by chemotherapy), coronary heart disease, 

CC acute and chronic renal failure, ischaemic disorders of skeletal muscle 

CC and ischaemic brain disorders of different aetiologies 
XX 

SQ Sequence 2781 BP; 658 A; 678 C; 765 G; 680 T; 0 U; 0 Other; 



Query Match 95.7%; Score 1783; DB 6; Length 2781; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1. 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TTT GTGCTCTTCCT GAATGGT CTT CGAGCAGAGGCT GGT GGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGCAGAACAAT GAGTCCTGTT CAGGGT CATCGGACTGCAAGGAGGGTGTCATCCTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 121 ACAGGGCAGAACAAT GAGT CCT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 180 

Qy 181 CCAATCT GGT AC C CGGAGAAC CCT T C C CT T GGGGACAAGATT GC CAGGGT CAT T GT CT AT 240 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CTATTGAAGTCATCACCT CTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 T CTATTGAAGTCATCACCT CTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 360 

Qy 361 ACC AGCACAACCACT AT T C GGGT CT GGAAT GAAACT GT CT C CAAC CT GAC CCTT AT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AC CAGCACAACCACT ATT CGGGT CT GGAAT GAAACT GT CTC CAAC CT GACC CTT AT GGC C 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 ATT GCT GGT GAT CT GGGAC CT T CT AC CATT GT AGGGAGT GCAGCCTT CAAC AT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 ATT GCT GGT GAT CT GGGAC CTT CT AC CATT GT AGGGAGT GCAGCCTT CAACAT GTT CAT C 540 

Qy 541 AT CATT GGCAT CT GT GT CT ACGT GAT CCCAGAC GGAGAGACT CGCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 541 ATCATT GGC ATCT GT GT CT AC GT GAT CCCAGAC GGAGAGACT CGCAAGAT CAAGCAT CT A 600 



Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 



Db 601 C GAGT CTT CTT CAT CAC C GCT GCT T GGAGT AT CTTTGC CT ACAT CT GGCT CTAT AT GATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I 1 I I I I I I II I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I 

Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I.I I I I I 

Db 781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

Qy 841 CACCCTAAGGGCATTGAGATGGAT GGGAAAATGATGAATT CCCATTTTCTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 C AC CCT AAGGGC AT TGAGAT GGAT GGGAAAAT GAT GAATT CCCATTTT CTAGAT GGGAAC 900 

Qy 901 CTGGTGCCCCT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CCGGATTCT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 CT GGT GCCCCT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GAT CCGGATTCTC 960 

Qy 961 AAGGAT CT GAAGCAAAAACACC CAGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 AAGGAT CT GAAGCAAAAACACC CAGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGC CAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1080 

Qy 1081 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAAC AT GCAGC AGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 ATGATGACT GGT GCAGGCAAT AT CCT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

Qy 1141 T CC AG CAT GAGC GAGGT GCAC ACCGAT GAGCCT GAGGACTT T ATT T C CAAGGT CTT CT TT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 T CC AGCAT GAGC GAGGT GCAC ACCGAT GAGCCT GAGGACTTTATT T C CAAGGT CTT CT TT 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

Qy 1261 AAAGGGGGAGACAT GT CAAAGACCAT GTAT GT GGACT ACAAAACAGAGGAT GGTT CTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 AAAGGGGGAGACAT GT CAAAGACCAT GTAT GTGGACTACAAAACAGAGGATGGTTCTGCC 1320 

Qy 1321 AATGCAGGGGCT GACT AT GAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 AATGCAGGGGCT GACTAT GAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

Qy 1381 C AGAAGGAGTT CT C CGT GGGC ATAATT GAT GAC GACAT T TTT GAGGAGGAT GAACACT T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CAGAAGGAGTTCT CCGTGGGCATAATTGAT GACGACATTTTTGAGGAGGATGAACACTTC 1440 



Qy 

Db 



1441 T TT GT AAGGTT GAGCAAT GT C CGC AT AGAGGAGGAGC AGCCAGAGGAGGGGAT GC CTC CA 1500 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
1441 TTTGT AAGGTT GAGCAAT GTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GCCTCCA 1500 



Qy 

Db 



1501 
1501 



GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 
I I I I I I I I I I I I I I I I I I I I 1 II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 1 I I I 
GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 



1560 
1560 



Qy 



Db 




Qy 



Db 



1621 GT CAGT GAGAGT AT T GGT GTT AT GGAGGT CAAGGTT CTGCGGACAT CAGGT GC C CGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 GT CAGT GAGAGT ATT GGT GTT ATGGAGGT CAAGGTT CT GCGGACAT CAGGT GCC CGGGGT 1680 



Db 




Qy 



1741 GAAGACACATATGGGGAGTTGGAATTCAAGAATGATGAAACTGTATGTGACAGACAGGAA 1800 




Db 



1741 GAAGAC AC AT AT GGGGAGT T GGAATT CAAGAAT GAT GAAAC T GT GAAAAC C AT AAG 1796 



Qy 



1801 GCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGC AGAGA 1841 



Db 



1797 GGTTAAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGA 1837 



RESULT 11 
ABN83428 

ID ABN83428 standard; cDNA; 2782 BP. 
XX 

AC ABN83428; 
XX 

DT 21-AUG-2002 (first entry) 
XX 

DE Human transporter protein coding sequence. 
XX 

KW Human; sodium/ calcium exchanger; transporter; brain; heart; kidney; lung; 

KW spleen; testis; leukocyte; foetal brain; chromosome 14; gene; ss. 

XX 

OS Homo sapiens . 
XX 

FH Key Location/Qualifiers 

FT CDS 10. .2775 

FT /*tag= a 

FT /product= "Human transporter" 
XX 

PN WO200233086-A2. 
XX 

PD 25-APR-2002. 
XX 

PF 17-OCT-2001; 2001WO-US032152 . 
XX 

PR 17-OCT-2000; 2000US-0240836P . 

PR 13-MAR-2001; 2001US-00804474 . 
XX 

PA (PEKE ) PE CORP NY. 
XX 



PI Merkulov GV, Ketchum KA, Shao W, Yan C, Di Francesco V; 

.PI Beasley EM; 

XX 

DR WPI; 2002-479677/51. 

DR P-PSDB; ABB83246. 
XX 

PT Human transporter peptide related to sodium/ calcium exchanger subfamily 

PT for identifying modulators useful for treating a disease or condition 

PT mediated by human transporter protein. 
XX 

PS Claim 4; Fig 1; 200pp; English. 
XX 

CC The present sequence is the coding sequence of a human transporter 

CC protein, which is related to the sodium/ calcium exchanger subfamily. 

CC Experimental data indicates expression of the transporter gene in humans 

CC in brain, heart, kidney, lung, spleen, testis, leukocyte and foetal 

CC brain. The gene of the transporter was mapped to chromosome 14 by ePCR 

XX 

SQ Sequence 2782 BP; 655 A; 685 C; 766 G; 676 T; 0 U; 0 Other; 

Query Match 95.7%; Score 1783; DB 6; Length 2782; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I 1 I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I 
Db 10 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 69 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 70 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 129 

Qy 121 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 130 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 189 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 190 CCAAT CT GGT AC CC GGAGAAC C CT T CCCT TGGGGACAAGATT GC CAGGGT CATT GT CTAT 249 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 250 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 309 

Qy 301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAA 360 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 310 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC CCAAT GGAGAA 369 

Qy 361 AC CAGC ACAAC CACT ATT C GGGTCT GGAAT GAAACT GTCT C CAAC CT GACCCTT AT GGCC 420 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 370 ACCAGCACAAC CACT ATT C GGGTCT GGAAT GAAACT GTCT C CAAC CT GACC CTT AT GGCC 429 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 489 

Qy 481 AT T GCT GGT GAT CT GGGACCTT CT AC CATT GT AGGGAGT GC AGC CTT CAACAT GTT CAT C 540 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

490 AT T GCT GGT GAT CT GGGACCTT CTAC CAT T GTAGGGAGT GCAGCCTTCAACAT GTT C AT C 549 

541 AT CATT GGCAT CT GT GT CT ACGT GAT CCCAGAC GGAGAGACT C GCAAGATCAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

550 AT CATT GGCAT CT GTGT CTACGTGATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 609 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
610 CGAGT CTT CTT CAT CAC CGCT GCTT GGAGT ATCT TT GCCT ACAT CT GGCT CT AT AT GAT T 669 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 729 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 789 

781 AT G C ACAAAAAGT AC C GC AC AGAC AAAC AC C GAGGAAT TAT C AT AGAGAC AGAGGGT G AC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
790 AT GCACAAAAAGT AC CGCACAGACAAACAC C GAGGAATT AT CAT AGAGAC AGAGGGT GAC 849 

841 CAC CCTAAGGGC AT T GAGAT GGAT GGGAAAAT GATGAAT T CC C AT T TT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
850 CAC CCTAAGGGC AT T GAGAT GGAT GGGAAAAT GATGAAT T CC CATTTT CT AGATGGGAAC 909 

901 CT GGT GCC C CT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGATGATCCGGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

910 CT GGT GCC C CT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GAT CCGGAT CCT C 969 

961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
970 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGTGGAGATGGCCAAT 1029 

1021 TACTAT GCT CTTT C CCAC CAACAGAAGAGC C GC GCCT T CT AC C GT AT CCAAGC CACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I 
1030 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1089 

1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1090 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 1149 

1141 TCCAGCATGAGCGAGGT GCACACCGATGAGCCT GAGGACTTT ATTT CCAAGGTCTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1150 T C CAGCAT GAGC GAGGT GCAC ACCGAT GAGCCT GAGGACTTT ATT T CCAAGGT CTT CTTT 1209 

1201 GAC CC AT GT TCTT AC C AGT GCCT GGAGAACT GT GGGGCT GTACT C CTGACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1210 GACCCAT GTT CTTACC AGT GCCT GGAGAACT GT GGGGCT GTACT C CT GACAGT GGT GAGG 1269 

1261 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GTGGACT ACAAAAC AGAGGAT GGTT CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1270 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACTACAAAAC AGAGGAT GGTT CTGCC 1329 

1321 AAT GCAGGGGCT GACTAT GAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1330 AAT GCAGGGGCT GACT AT GAGTT C ACAGAGGGCACGGT GGTT CTGAAGCCAGGAGAGACC 1389 

Qy 1381 CAGAAGGAGTT CT C CGT GGGCATAATT GAT GACGACATTTTT GAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I MM I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1390 CAGAAGGAGTT CT C CGT GGGCATAATT GAT GACGACATTTTT GAGGAGGAT GAACACTTC 1449 

Qy 1441 TTT GTAAGGTT GAGCAAT GT C C GCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GC CTCCA 1500 

M M M M M M M M M M M M M M M M M M M M M I I M M M M M M M M 

Db 1450 TTT GTAAGGTT GAGCAAT GT C C GCAT AGAGGAGGAGCAGC CAGAGGAGGGGATGC CTCCA 1509 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

II I I II II I I I I I I I I I I I I I I I I I I I I II I II I I M I I I I I I I I I I I I I I I I I I I II I I 

Db 1510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1569 

Qy 1561 GTTACCAT CTTGGATGATGACCATGCAGGCAT CTTCACTTTTGAATGTGATACTATTCAT 1620 

I I I I I I I I I I I I II I M I I I I I I I I I I I I I I II I I I II I I I I I I I I I II II I I I I I II I I 
Db 1570 GTTACCATCTT GGATGATGACCAT GCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 1629 

Qy 1621 GTCAGT GAGAGT AT TGGT GTT ATGGAGGT CAAGGTTCT GC GGACAT CAGGT GC C CGGGGT 1680 

I I II I I I I I I II II I II I M I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I 
Db 1630 GTCAGT GAGAGT AT TGGT GTT AT GGAGGT CAAGGTT CT GC GGACAT CAGGT GCCCGGGGT 1689 

Qy 1681 AC AGT CAT C GT C C C CT T TAGGACAGT AGAAGGGAC AGC CAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I I II II I I II II I I I I I I I I II I I I I II I II I I I I I II I I I II I II I I I II I 
Db 1690 ACAGT CAT CGT C C C CT T TAGGACAGT AGAAGGGACAGC CAAGGGT GGCGGT GAGGACTTT 1749 

Qy 1741 GAAGAC ACAT AT GGGGAGTT GGAAT T CAAGAAT GATGAAACT GTATGT GAC AGAC AGGAA 1800 

I I II II I I I I II II I I II II I I I II I I I II I I I I II I II I I I I I I I I II I 

Db 1750 GAAGACACAT AT GGGGAGT T GGAAT T CAAGAAT GATGAAAC T GT GAAAACCATAAG 1805 

Qy 1801 GCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGA 1841 

III I I I I II II I I I I I I I I I I I I 

Db 1806 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 1846 



RESULT 12 
ADH42302 

ID ADH42302 standard; DNA; 2828 BP. 
XX 

AC ADH42302; 
XX 

DT 25-MAR-2004 (first entry) 
XX 

DE Novel human nucleic acid NOV55a. 
XX 

KW ds; gene; cardiovascular; antiarteriosclerotic; hypotensive; cytostatic; 

KW anorectic; antidiabetic; immunosuppressive; anti-HIV; neuroprotective; 

KW nootropic; antiparkinsonian; antiasthmatic; antiinf ertility; 

KW cardiomyopathy; atherosclerosis; hypertension; cancer; obesity; diabetes; 

KW AIDS; multiple sclerosis; graf t-versus-host disease; Alzheimer's disease; 

KW Parkinson's disease; asthma; fertility disorder; chromosome mapping; 

KW tissue typing; preventive medicine; pharmacogenomic; vaccine. 
XX 

OS Homo sapiens. 
XX 

PN WO2003102159-A2. 
XX 
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PR 
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PR 


13 


-SEP- 


•2002 


PR 


23 


-SEP- 
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•2002 


PR 


23 


-OCT- 


•2002 



2003WO-US017573 

2002US-0385490P 
2002US-0385615P 
2002US-0385755P 
2002US-0386041P 
2002US-0386355P 
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PR 24-OCT-2002; 2002US-0420852P . 
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PR 01-NOV-2002; 2002US-0423095P . 

PR 05-NOV-2002; 2002US-0423748P . 
XX 

PA (CURA-) CURAGEN CORP. 
XX 

PI Alsobrook JP, Anderson DW, Baumgartner JC, Berghs C, Boldog FL; 

PI Burgess CE, Casman SJ, Catterton E, Dhanabal M, Edinger SR; 

PI Ellerman K, Ettenberg S, Gangolli EA, Gerlach VL, Gorman L; 

PI Grosse WM, Gunther E, Guo X, Gusev VY, Herrmann JL, Ji W, Kekuda R; 

PI Khramtsov NV, Larochelle WJ, Li L, Liang H, Low K, Macdougall JR; 

PI Maclachlan T, Malyankar UM, Mcqueeney K, Mezick AJ, Miller CE; 

PI Millet I, Padigaru M, Patturajan M, Peyman JA, Qian X, Rastelli L; 

PI Rieger DK, Rothenberg ME, Shenoy SG, Shimkets RA, Smithson G; 

PI Spytek KA, Stone DJ, Sukumaran S, Szekeres ES, Vernet CAM, Voss EZ; 

PI Wolenc AR, Zhong M, Zhong H; 

XX 

DR WPI; 2004-053467/05. 

DR P-PSDB; ADH42303. 
XX 

PT New NOVX polypeptides and nucleic acid molecules useful for preventing or 

PT treating NOVX-associated disorders, e.g. cancer, cardiomyopathy, 

PT atherosclerosis or diabetes, in chromosome mapping, tissue typing or in 

PT pharmacogenomics . 

XX 

PS Claim 20; SEQ ID NO 855; 1503pp; English. 
XX 

CC The invention relates to 566 new isolated human polypeptides and their 

CC encoding genes, sequences that are at least 95% identical to these or 

CC sequences comprising one or more conservative substitutions in these. The 

CC polypeptide, polynucleotide and antibodies against the polypeptides are 

CC useful in diagnosing, treating or preventing NOVX-associated disorders, 

CC e.g. cardiomyopathy, atherosclerosis, hypertension, cancer, obesity, 

CC diabetes, AIDS, multiple sclerosis, graf t-versus-host disease, 

CC Alzheimer's disease, Parkinson's disease, asthma, or fertility disorders. 

CC The nucleic acids are further used as hybridization probes, in chromosome 

CC mapping, tissue typing, preventive medicine, and pharmacogenomics. The 

CC polypeptides are also useful as vaccines. This sequence represents an 

CC example of the nucleic acid sequence of the invention. 

XX 

SQ Sequence 2828 BP; 670 A; 692 C; 778 G; 688 T; 0 U; 0 Other; 

Query Match 95.7%; Score 1783; DB 12; Length 2828; 
Best Local Similarity 98.4%.;... Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 63 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 122 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I II II I 

Db 123 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 182 



Qy 121 ACAGGGCAGAACAAT GAGT CCT GT T CAGGGTC ATCGGACT GCAAGGAGGGT GTCAT CCT G 180 



1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 

Db 183 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGTC AT CGGACT GCAAGGAGGGT GTCAT C CT G 242 

Qy 181 CCAAT CT GGT AC CC GGAGAACC CTT CC CT T GGGGACAAGATTGC CAGGGT C ATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I II I I I I I I I I I I 
Db 243 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 302 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 303 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 362 

Qy 301 T CT ATTGAAGT CAT C ACCT CT CAAGAGAGGGAGGT GACAATTAAGAi^VCCCAAT GGAGAA 360 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 363 T CT ATT GAAGT CAT C ACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAA 422 

Qy 361 AC CAGCACAACCACT ATT C GGGTCT GGAAT GAAACT GT CT C CAACCT GACCCTT ATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 423 AC C AGCACAAC CACT ATT C GGGT CT GGAAT GAAACT GT CT C CAACCT GAC C CTTAT GGCC 482 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 483 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 542 

Qy 4 81 AT T GCTGGT GAT CT GGGACCT T CT AC C ATT GT AGGGAGTGCAGCCTT CAACATGTTCAT C 540 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 543 ATT GCTGGT GAT CT GGGACCT T CT AC CAT T GT AGGGAGT GC AGCCTT CAACAT GTTCAT C 602 

Qy 541 AT CATTGGCAT CT GT GTCT ACGT GAT CCCAGACGGAGAGACTC GCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 603 AT CATTGGCAT CT GT GT CT AC GTGAT CC CAGACGGAGAGACTC GCAAGAT CAAAC AT CT A 662 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 663 C GAGT CTT CTT CAT C ACC GCT GCT T GGAGT AT CTT T GC CT ACAT CT GGCTCT AT ATGATT 722 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 723 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 782 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 783 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 842 

Qy 781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTAT CATAGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 843 AT GCACAAAAAGT AC CGCACAGACAAACAC CGAGGAAT TAT CATAGAGACAGAGGGT GAC 902 

Qy 841 CACC CTAAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAAT T C CC ATTTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 903 CACCCTAAGGGCATTGAGATGGAT GGGAAAATGATGAATT CCCATTTTCTAGATGGGAAC 962 

Qy 901 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGATGAT CC GGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 963 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT C C CGCAGAGAGAT GAT C C GGATT CT C 1022 

Qy 961 AAGGATCT GAAGCAAAAAC ACC CAGAGAAGGACTT AGAT C AGCT GGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1023 AAGGAT CTGAAGCAAAAAC ACC C AGAGAAGGACT T AGAT C AGCT GGT GGAGAT GGC CAAT 1082 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I 
Db 1083 TACT AT GCT CTTT CC CAC CAACAGAAGAGCC GCGC CTT CT AC CGTAT CCAAGCCACT CGT 1142 

Qy 1081 AT GAT GACT GGT GCAGGCAATAT CCT GAAGAAAC AT GCAGCAGAACAAGCCAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1143 AT GAT GACT GGT GCAGGCAAT ATC CT GAAGAAAC AT GCAGCAGAACAAGC CAAGAAGGCC 1202 

Qy 1141 T CCAGC AT GAGCGAGGTGCACACC GAT GAGCCT GAGGACTTTATTTCCAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1203 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1262 

Qy 1201 GACC CAT GTT CTT AC C AGT GC CT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1263 GACC CAT GTT CTT AC CAGT GC CT GGAGAACT GT GGGGCT GT ACT C CT GACAGTGGT GAGG 1322 

Qy 1261 AAAGGGGGAGAC ATGT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1323 AAAGGGGGAGACATGT CAAAGAC CATGT AT GT GGACT ACAAAACAGAGGAT GGTTCT GCC 1382 

Qy 1321 AATGCAGGGGCTGACTAT GAGTT CACAGAGGGCACGGT GGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1383 AATGCAGGGGCTGACTAT GAGTT CACAGAGGGCACGGT GGTT CTGAAGCCAGGAGAGACC 1442 

Qy 1381 C AGAAGGAGTT CT CC GT GGGC ATAATT GAT GAC GAC AT TTTT GAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1443 C AGAAGGAGTT CT CC GT GGGCATAATT GAT GAC GAC AT TTTT GAGGAGGAT GAACACTT C 1502 

Qy 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1503 T T T GTAAGGTTGAGCAAT GT CCGCATAGAGGAGGAGCAGC CAGAGGAGGGGAT GCCT CCA 1562 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1563 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1622 

Qy 1561 GTTACCAT CTTGGATGAT GACCATGCAGGCAT CTTCACTTTTGAATGT GATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1623 GTT AC CAT CTTGGAT GAT GACCAT GCAGGCAT CTT C ACTTTT GAAT GT GAT ACT ATT CAT 1682 

Qy 1621 GT CAGT GAGAGT ATT GGT GTT AT GGAGGT CAAGGTT CT GCGGACAT CAGGT GCCCGGGGT 1680 

I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I 
Db 1683 GTC AGT GAGAGT ATT GGT GTT AT GGAGGT CAAGGTT CT GCGGACAT CAGGT GCCCGGGGT 1742 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1743 ACAGT CAT C GT CCC CTTT AGGACAGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 1802 

Qy 1741 GAAGAC ACAT AT GGGGAGTTGGAATT CAAGAAT GAT GAAACT GT ATGT GACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1803 GAAGACAC AT AT GGGGAGT T GGAATT CAAGAAT GAT GAAAC T GT GAAAAC C AT AAG 1858 

Qy 1801 GCT GACT AT GGAAGAAGAGGAGGCCAAGAGGATAGC AGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

Db 1859 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 1899 
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XX 
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KW cystic fibrosis; diabetes mellitus; Parkinson's disease; cancer; 

KW neurological disorder; Alzheimer's disease; Huntington's disease; 

KW immunological disorder; AIDS; asthma; cell proliferative disorder; 

KW transgenic; gene therapy; neuroprotective; antidiabetic; cytostatic; 

KW antiparkinsonian; hypotensive; nootropic; antianaemic; anticonvulsant; 

KW cerebroprotective; cardiant; anti-HIV; human immunodeficiency virus; 

KW antiasthmatic; antiatherosclerotic; antigout; antiarteriosclerotic; 

KW hepatotropic; antiinflammatory; virucide; cytostatic; gene; ss. 
XX 
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XX 
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XX 
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XX 
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XX 

PT Novel human transporter and ion channel polypeptide, useful in diagnosis, 

PT prevention or treatment of transport, neurological, muscle, immunological 

PT and cell proliferative disorders. 
XX 

PS Claim 96; SEQ ID NO 41; 146pp + Sequence Listing; English. 
XX 

CC The invention relates to human transporter and ion channel polypeptide 

CC (TRICH) (I) selected from one of 32 polypeptide sequences (ABP74096- 



CC ABP74127), a naturally occurring polypeptide comprising a sequence having 

CC at least sequence 90 % identity to (I) or a biologically active or 

CC immunogenic fragment of (I) . (I) is useful for screening a compound for 

CC effectiveness as an agonist or antagonist, for screening a compound that 

CC specifically binds (I) or modulates the activity of (I) and for preparing 

CC a polyclonal or monoclonal antibody by hybridoma technology. 

CC Polynucleotides (II, ABZ33727-ABZ33758 ) encoding (I) are useful for 

CC screening a compound altering gene expression. (I) and (II) are useful in 

CC a diagnostic tests for a condition or a disease associated with the 

CC expression of TRICH in a biological sample, especially disorders selected 

CC from a transport disorder such as cystic fibrosis, diabetes mellitus, 

CC Parkinson's disease, cardiac disorders, neurological disorders such as 

CC Alzheimer's disease, Huntington's disease, muscle disorders, 

CC immunological disorder such as AIDS, asthma and atherosclerosis, and cell 

CC proliferative disorder such as arteriosclerosis, cirrhosis, hepatitis and 

CC cancer. (II) is useful for creating knock-in humanised animals or 

CC transgenic animals to model human diseases, in somatic or germline gene 

CC therapy, to generate a transcript image of a tissue or cell type, for 

CC detecting differences in the chromosomal location due to translocation, 

CC inversion among normal, carrier or affected individuals and for mapping 

CC genomic sequences. Note: The sequence data for this patent is not 

CC represented in the printed specification but is based on sequence 

CC information supplied to Derwent by the European Patent Office 

XX 

SQ Sequence 2966 BP; 692 A; 725 C; 809 G; 740 T; 0 U; 0 Other; 



Query Match 95.7%; Score 1783; DB 6; Length 2966; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 



Qy 


1 


ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 


60 






1 1 1 1 II 1 1 I 1 1 ! 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 I 1 




Db 


201 


ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 


260 


Qy 


61 


TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 


120 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


261 


TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 


320 


Qy 


121 


AC AGGGCAGAACAAT GAGT C CT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 


180 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 




Db 


321 


ACAGGGCAGAACAAT GAGT C CT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 


380 


Qy 


181 


CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 


240 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


381 


CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 


440 


Qy 


241 


TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 


300 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


441 


TTT GT GGC C CT GAT AT AC AT GT TC CT T GGG GTGT C CAT CATT GCT GACC GCT T CAT GGCA 


500 


Qy 


301 


T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAATTAAGAAAC CCAAT GGAGAA 


360 






1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


501 


T CT ATT GAAGT CATC ACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 


560 


Qy 


361 


ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 


420 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


561 


ACC AGCACAAC C ACT ATT C GGGTCT GGAATGAAACT GT CT CCAAC CT GACC CT TAT GGCC 


620 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



421 



621 



481 



681 



541 



741 



601 



801 



661 



861 



721 



921 



781 



981 



841 



CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 
I I I I I I I I I I I I I I I I I II I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 680 

ATT GCT GGT GAT CTGGGAC CTT CT ACCATT GT AGGGAGT GCAGC CTT CAACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATTGCT GGT GAT CTGGGAC CTT CT ACCATT GT AGGGAGT GCAGC CTT CAACAT GTT CAT C 740 

AT C ATT GGCATCT GT GTCTAC GT GAT CCCAGACGGAGAGACT CGCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AT CATT GGCATCT GT GT CT AC GT GAT CCCAGACGGAGAGACT CGCAAGAT CAAGCATCTA 800 

CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 860 

CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 920 

T TT C C AGTGT GT GTCCTT CT GGC CT GGGT GGCAGAT AAACGACT GCT CTT CTACAAATAC 780 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

T TT C CAGTGT GT GT CCTT CT GGC CT GGGT GGCAGAT AAACGACT GCT CTT CTACAAATAC 980 

ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

AT GCACAAAAAGT ACC GCAC AGACAAACAC CGAGGAATT AT CAT AGAGACAGAGGGT GAC 1040 



900 



CACCCTAAGGGCATTGAGATGGAT GGGAAAAT GATGAATTCCCATTTT CTAGAT GGGAAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1041 CACCCTAAGGGCATTGAGATGGAT GGGAAAAT GATGAATTCCCATTTT CTAGAT GGGAAC 1100 



901 



960 



CTGGT GC CC CT GGAAGGGAAGGAAGT GGAT GAGT C CCGCAGAGAGAT GAT CC GGATT CT C 

I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I 
1101 CT GGT GC C C CT GGAAGGGAAGGAAGT GGAT GAGT C C CGCAGAGAGAT GAT CC GGATT CT C 1160 

961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTT AGAT CAGCT GGTGGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1161 AAGGAT CTGAAGCAAAAACAC CCAGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGC CAAT 1220 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 
I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1280 



1221 



1081 ATGATGACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

1281 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 1340 

1141 T CCAGC ATGAGC GAGGT GCAC AC CGAT GAGCCT GAGGACTTT AT TTCCAAGGT CTT CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1341 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1400 

1201 GACCCAT GT T CTT AC C AGT GCCT GGAGAACT GT GGGGCT GT ACT C CT GAC AGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1401 GACC CAT GTT CT T AC CAGT GCCT GGAGAACT GT GGGGCT GT ACT CCT GAC AGT GGT GAGG 14 60 



Qy 

Db 



1261 
1461 



AAAGGGGGAGACAT GT CAAAGACCAT GTAT GTGGACT ACAAAACAGAGGAT GGTTCT GC C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAAGGGGGAGACAT GT CAAAGACCAT GTAT GT GGACT ACAAAACAGAGGAT GGTTCT GCC 



1320 
1520 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1321 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I II I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I II I I 
1521 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1580 

1381 CAGAAGGAGTTCTCCGTGGGCATAATTGAT GACGACATTTTTGAGGAGGATGAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1581 CAGAAGGAGT T CTC CGT GGGC ATAATT GAT GACGAC ATTTTT GAGGAGGAT GAACACTT C 1640 

1441 T TTGTAAGGTT GAGCAATGT C C GCAT AGAGGAGGAGCAGCC AGAGGAGGGGATGCCT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1641 T TTGTAAGGTT GAGCAAT GT C C GC AT AGAGGAGGAGCAGC CAGAGGAGGGGATGC CT C C A 1700 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
17 01 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1760 

1561 GTTACCATCTT GGAT GAT GAC CAT GCAGGCAT CTT CACTTTT GAAT GTGAT ACTATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1761 GTT AC CATCTT GGAT GAT GAC CAT GCAGGCAT CTT CACTTTT GAAT GT GAT ACT ATTC AT 1820 

1621 GT CAGT GAGAGT ATT GGT GTT AT GGAGGT CAAGGTT CTGC GGACAT CAGGT GCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1821 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1880 

1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1881 ACAGT CATC GT C CCCTTT AGGACAGT AGAAGGGAC AGCCAAGGGT GGCGGT GAGGACTT T 1940 

1741 GAAGACAC AT AT GGGGAGTT GGAATT CAAGAATGAT GAAACT GTAT GT GACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

1941 GAAGACACAT AT GGGGAGTT GGAATT CAAGAATGAT GAAAC T GT GAAAACCATAAG 1996 

1801 GCTGACTATGGAAGAAGAGGAGGCCAAGAGGATAGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I II 

1997 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 2037 



RESULT 14 
ABN83429 

ID ABN83429 standard; DNA; 126512 BP. 
XX 

AC ABN83429; 
XX 

DT 21-AUG-2002 (first entry) 
XX 

DE Human transporter protein gene. 
XX 

KW Human; sodium/ calcium exchanger; transporter; brain; heart; kidney; lung; 

KW spleen; testis; leukocyte; foetal brain; chromosome 14; gene; 

KW single nucleotide polymorphism; SNP; ds . 
XX 

OS Homo sapiens. 
XX 



FH Key Location/Qualifiers 

FT variation replace (378, T) 

FT /*tag= a 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (741. .742,C-) 

FT /*tag= b 

FT /standard_name= "Single nucleotide polymorphism" 

FT /note= "This variation is an indel" 

FT variation replace (2002, T) 

FT /+tag= c 

FT /standard_name= "Single nucleotide polymorphism" 

FT CDS 2010. .124505 

FT /*tag= d 

FT /product= "Human transporter" 

FT /note= "Contains 5 introns" 

FT exon 2010. .3793 

FT /*tag= e 

FT /number= 1 

FT variation replace (2381, C) 

FT /*tag= f 

FT /standard_name= "Single nucleotide polymorphism" 

FT intron 3794. .109509 

FT /*tag= g 

FT /number= 1 

FT variation replace ( 5165, T) 

FT /*tag= h 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 5402 , G) 

FT /*tag= i 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 6794 , C) 

FT /*tag= j 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 9883, G) 

FT /*tag= k 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 10210, C) 

FT /*tag= 1 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 12220, G) 

FT /*tag= m 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 13842, G) 

FT /*tag= n 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 14200, A) 

FT /*tag= o 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 15878, T) 

FT /*tag= p 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 16030, G) 

FT /*tag= q 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 16292, C) 

FT /*tag= r 

FT /standard_name= "Single nucleotide polymorphism" 



FT variation replace (16506, G) 

FT /*tag= s 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (17953, A) 

FT /*tag= t 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (23832, G) 

FT /*tag= u 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (25001, A) 

FT /*tag= v 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (25141, G) 

FT /*tag= w 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (25191, G) 

FT /*tag= x 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (26147, A) 

FT /*tag= y 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (27400, G) 

FT /*tag= z 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (27401, T) 

FT /*tag= aa 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (29278, C) 

FT /*tag= ab 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 31437, G) 

FT /*tag= ac 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (31857, G) 

FT /*tag= ad 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 33155, A) 

FT /*tag= ae 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (39487, C) 

FT /*tag= af 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (41449, C) 

FT /*tag= ag 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (42420, C) 

FT /*tag= ah 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 43256, C) 

FT /*tag= ai 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (43967, C) 

FT /*tag= aj 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 48603 . . 48604, A-) 

FT /*tag= ak 

FT /standard_name= "Single nucleotide polymorphism" 



FT /note= "This variation is an indel" 

FT variation replace (49560, T) 

FT /*tag= al 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (52729, G) 

FT /*tag= am 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (55031, G) 

FT /*tag= an 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (55066, C) 

FT /*tag= ao 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (56912, G) 

FT /*tag= ap 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (58480, T) 

FT /*tag= aq 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 61128, A) 

FT /*tag= ar 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 61320, A) 

FT /*tag= as 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (61444, C) 

FT /*tag= at 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 62641, C) 

FT /*tag= au 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 63023, G) 

FT /*tag= av 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (63051, C) 

FT /*tag= aw 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 64989, G) 

FT /*tag= ax 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 65929, A) 

FT /*tag= ay 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (66694, G) 

FT /*tag= az 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 66755, A) 

FT /*tag= ba 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (66879, C) 

FT /*tag= bb 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 69156, T) 

FT /*tag= be 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (69280, T) 

FT /*tag= bd 



FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 70647 , T) 

FT /*tag= be 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation ' replace ( 71867 , T) 

FT /*tag= bf 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 71900, T) 

FT /*tag= bg 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 71901, A) 

FT /*tag= bh 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 72369, T) 

FT /*tag= bi 

Query Match 95.7%; Score 1782.8; DB 6; Length 126512; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1784; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2010 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 2069 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2070 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 2129 

Qy 121 ACAGGGC AGAACAAT GAGT CCT GTT CAGGGT CAT C GGACTGCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 2130 ACAGGGC AGAACAAT GAGT C CT GT T CAGGGT CATCGGACTGCAAGGAGGGT GT CAT CCT G 2189 

Qy 181 C CAAT CT GGT ACC CGGAGAACC CT T C CCTT GGGGACAAGAT T GCC AGGGT CATT GT CTAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2190 CCAAT CT GGT ACC CGGAGAAC CCT T C C CTT GGGGACAAGAT T GCC AGGGT CAT T GT CTAT 2249 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2250 TTT GTGGCC CTGATAT ACAT GTT C CTT GGGGT GT CCAT CATT GCT GAC C GCTT CAT GGCA 2309 

Qy 301 T CT ATT GAAGTC AT C ACCT CT CAAGAGAGGGAGGT GACAATT AAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2310 T CT ATT GAAGTCAT C ACCT CT CAAGAGAGGGAGGT GACAAT TAAGAAACC CAAT GGAGAA 2369 

Qy 361 ACCAGC ACAACCACT ATT C GGGT CT GGAAT GAAACT GT CTC CAAC CT GAC C CTT AT GGCC 420 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2370 ACCAGCACAACAACT ATT C GGGT CT GGAAT GAAACT GT CTCCAAC CT GACC CTT AT GGCC 2429 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 2489 

Qy 481 ATT GCT GGT GAT CT GGGAC CTT CT ACCATT GT AGGGAGT GCAGCCTT CAACAT GTT CAT C 540 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2490 ATT GCT GGT GAT CTGGGACCT T CT AC CATT GT AGGGAGT GC AGC CTT CAACAT GTT CAT C 2549 

Qy 541 ATCATTGGCATCT GT GTCTACGT GAT CCCAGACGGAGAGACT CGCAAGATCAAGCATCTA 600 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db, 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

2550 ATCATT GGC ATCT GT GTCTAC GT GAT CCCAGACGGAGAGACT CGCAAGAT CAAGCAT CT A 2609 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I 
2610 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 2669 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 
I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 2729 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 2789 

781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I II I I I I 
2790 AT GC ACAAAAAGT ACC GCACAGACAAAC AC CGAGGAATTAT CATAGAGACAGAGGGT GAC 2849 

841 CACC CTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT CCCAT TTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2850 CACCCTAAGGGCATTGAGATGGAT GGGAAAATGATGAATTCCCATTTT CTAGAT GGGAAC 2909 

901 CTGGT GCCC CTGGAAGGGAAGGAAGT GGAT GAGT CCCGCAGAGAGAT GAT C CGGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2910 CT GGT GCCC CTGGAAGGGAAGGAAGT GGAT GAGT CC CGCAGAGAGAT GAT C CGGATT CT C 2969 

961 AAGGAT CT GAAGCAAAAACAC CC AGAGAAGGACTT AGAT CAGCTGGT GGAGAT GGCCAAT 1020 

r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

2970 AAGGAT CT GAAGCAAAAACAC CCAGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC CAAT 3029 

1021 T ACT AT GCT CTT T CC CACCAACAGAAGAGC CGC GC CT T CT ACCGT AT CCAAGCCACT CGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I. I I I I I I I I 
3030 TACT AT GCT CTT T CC CACCAACAGAAGAGC C GC GC CTT CT ACCGT AT CCAAGCCACT C GT 3089 

1081 AT GAT GACT GGT GCAGGCAAT ATC CTGAAGAAAC AT GC AGCAGAACAAGC CAAGAAGGCC 1140 

I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
3090 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGCC 3149 

1141 T CCAGCAT GAGC GAGGTGCAC ACCGAT GAGCCT GAGGACTTT ATTT CCAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3150 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 3209 

1201 GAC CCAT GTT CT T AC CAGT GC CT GGAGAACT GT GGGGCT GT ACT C CT GAC AGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3210 GAC CCAT GTT CTT AC CAGT GCCT GGAGAACT GT GGGGCT GT ACT C CT GACAGT GGT GAGG 3269 

1261 AAAGGGGGAGACATGT CAAAGACCAT GTATGTGGACT ACAAAACAGAGGATGGTTCT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
3270 AAAGGGGGAGACATGT CAAAGAC CAT GT AT GT GGACT ACAAAAC AGAGGAT GGTT CT GC C 3329 

1321 AAT GCAGGGGCT GACT AT GAGTT CAC AGAGGGCACGGT GGTT CT GAAGCCAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3330 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGC AC GGT GGTT CT GAAGCCAGGAGAGAC C 3389 

1381 CAGAAGGAGT T CT CC GTGGGCATAATT GAT GAC GACATT T T T GAGGAGGAT GAAC ACTT C 1440 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



3390 CAGAAGGAGTT CTC CGT GGGCATAATTGAT GACGACATTTTTGAGGAGGATGAACACTT C 3449 



Qy 1441 TTT GTAAGGTT GAGCAAT GT CCGCAT AGAGGAGGAGCAGCCAGAGGAGGGGATGC CTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3450 T TT GTAAGGTT GAGCAAT GT CCGCAT AGAGGAGGAGCAGC CAGAGGAGGGGATGC CTC CA 3509 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 3510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 3569 

Qy 1561 GTTACCATCTTGGATGATGACCATGCAGGCATCTT CACTTTTGAAT GT GATACTATTCAT 1620 

I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3570 GTT ACC AT CTT GGATGAT GACCATGCAGGCAT CTT CACTTTT GAAT GT GATACTATTCAT 3629 

Qy 1621 GTCAGT GAGAGT ATTGGT GT TAT GGAGGT CAAGGT TCT GCGGACAT CAGGT GCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3630 GTCAGT GAGAGT ATTGGT GT TAT GGAGGT CAAGGTTCT GCGGACAT CAGGT GCCCGGGGT 3689 

Qy 1681 ACAGT CAT CGT C CC CT T T AGGACAGT AGAAGGGAC AGC CAAGGGT GGC GGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3690 ACAGT CAT CGT C CC CT TT AGGACAGT AGAAGGGAC AGCCAAGGGTGGC GGTGAGGACTTT 3749 

Qy 1741 GAAGAC ACATAT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GTAT 1786 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3750 GAAGAC ACATAT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GTGT 3795 



RESULT 15 
ABX56261 



ID ABX56261 standard; DNA; 2813 BP. 
XX 

AC ABX56261; 
XX 

DT 19-FEB-2003 (first entry) 
XX 

DE Human NOVla CG56258-01 DNA SEQ ID 1. 
XX 

KW NOVX; human; antidiabetic; antiarteriosclerotic; anorectic; nootropic; 

KW metabolic; antimicrobial; neuroprotective; antiparkinsonian; cardiant; 

KW antilipaemic; cytostatic; immunomodulatory; gene therapy; dyslipidaemia; 

KW cardiomyopathy; metabolic disorder; diabetes; atherosclerosis; obesity; 

KW anorexia; neurodegenerative disorder; Alzheimer's disease; cancer; gene; 

KW Parkinson's disease; haematopoietic disorder; metabolic disturbance; 

KW metabolic syndrome X; wasting disease; ds . 
XX 

OS Homo sapiens . 

XX 

PN WO200281625-A2. 
XX 

PD 17-OCT-2002. 
XX 

PF 03-APR-2002; 2002WO-US010366 . 
XX 

PR 03-APR-2001; 2001US-0281086P . 

PR 05-APR-2001; 2001US-0281906P . 

PR 06-APR-2001; 2001US-0282020P . 

PR 10-APR-2001; 2001US-0282930P . 



PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
PR 
XX 
PA 
XX 
PI 
PI 
PI 
PI 
PI 
PI 
XX 
DR 
DR 
XX 
PT 
PT 
PT 
PT 
XX 
PS 
XX 

cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 
cc 



12 


-APR- 


•2001 


; 2001US- 


0283444P. 


12 


-APR- 


•2001 


; 2001US- 


0283512P. 


13 


-APR- 


•2001, 


; 2001US- 


0283657P. 


13 


-APR- 


•2001, 


? 2001US- 


0283678P. 


13 


-APR- 


•2001, 


? 2001US- 


0283710P. 


17 


-APR- 


•2001, 


? 2001US- 


0284234P. 


19 


-APR- 


•2001, 


• 2001US- 


0285325P. 


20 


-APR- 


•2001, 


• 2001US- 


0285381P. 


24 


-APR- 


2001, 


• 2001US- 


0286068P. 


25 


-APR- 


•2001, 


' 2001US- 


0286292P. 


07 


-JUN- 


2001, 


• 2001US- 


0296692P. 


26 


-JUN- 


2001, 


• 2001US- 


0300883P. 


08 


-AUG- 


2001, 


• 2001US- 


0311003P. 


13 


-AUG- 


2001, 


• 2001US- 


0311973P. 


16 


-AUG- 


2001, 


• 2001US- 


0312901P. 


14 


-SEP- 


2001, 


• 2001US- 


0322283P. 


05 


-OCT- 


2001, 


• 2001US- 


0327448P. 


31 


-DEC- 


2001, 


• 2001US- 


0345734P. 


03 


-JAN- 


2002, 


• 2002US- 


0345755P. 


04 


-FEB- 


2002, 


• 2002US- 


0354391P. 


02 


-APR- 


2002, 


• 2002US- 


00114153. 



(CURA-) CURAGEN CORP. 



Padigaru M, 
Smithson G, 
Zerhusen BD, 
Malyankar UM, 



Shenoy SG, Kekuda 
Guo X, Gerlach V, 
Tchernev VT, Gangolli 
Patturajan M, Miller 



R, Rastelli L f Mezes PD; 
Casman SJ, Boldog FL, Li L; 

EA, Vernet CAM, Spytek KA; 

Taupier RJ, Heyes MP, Ju 



Peyman JA, 
Mazur A; 



Catterton E, Macdougall 



CE, 
JR, 



J; 



Edinger SR, Stone DJ; 



WPI; 2003-046862/04. 
P-PSDB; ABU12041. 

New isolated NOVX polypeptide useful for treating cardiomyopathy, 
atherosclerosis, metabolic disorders, diabetes, obesity, infectious 
disease, anorexia, neurodegenerative disorders, Alzheimer's disease and 
cancer. 

Claim 3; Page 83-84; 425pp; English. 

This invention describes novel polypeptides, termed NOVX which have 
antidiabetic, antiarteriosclerotic, anorectic, metabolic, antimicrobial, 
neuroprotective, antiparkinsonian, antilipaemic, cytostatic, nootropic, 
cardiant and immunomodulatory activity. The polypeptide and any 
antibodies generated from, it are useful in the manufacture of a 
medicament for treating a syndrome associated with a human disease 
selected from a pathology associated with the NOVX polypeptide. Fragments 
and portions of the polynucleotides encoding NOVX polypeptides are useful 
to map the location of NOVX genes on a chromosome, to identify 
individuals from minute biological samples, as DNA markers for 
restriction fragment length polymorphism (RFLP) , and are useful to 
prepare polymerase chain reaction primers. The products of the invention 
can be used in gene therapy and for treating cardiomyopathy, metabolic 
disorders, diabetes, atherosclerosis, obesity, infectious disease, 
anorexia, neurodegenerative disorders, Alzheimer's disease, Parkinson's 
disease, immune disorders, haematopoietic disorders, and various 



CC dyslipidaemias, metabolic disturbances associated with obesity, metabolic 

CC syndrome X and wasting disorders associated with chronic diseases and 

CC various cancers. ABX56261-ABX56306 represent the polynucleotide fragments 

CC which encode the NOVX polypeptides represented in ABU12041-ABU12086 

XX 

SQ Sequence 2813 BP; 617 A; 716 C; 813 G; 667 T; 0 U; 0 Other; 

Query Match 95.7%; Score 1782.4; DB 8; Length 2813; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1783; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I 
Db 9 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 68 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 69 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 128 

Qy 121 AC AGGGCAGAACAAT GAGT C CT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 129 ACAGGGCAGAACAAT GAGT CCTGTT CAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 188 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 189 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 248 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 249 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 308 

Qy 301 T CT ATT GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 309 TCTATT GAAGTCATCACCT CTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 368 

Qy 361 AC CAGCACAACC ACT ATTC GGGT CT GGAATGAAACT GT CT CCAACCTGAC CCT TAT GGCC 420 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 369 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 428 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 429 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 488 

Qy 481 ATT GCT GGT GAT CT GGGAC CTT CT ACC ATTGT AGGGAGT GC AGC CTT CAAC AT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 489 AT T GCT GGT GAT CT GGGAC CTT CTACC ATTGT AGGGAGT GCAGCCTTCAAC AT GTT CAT C 548 

Qy 541 AT CATT GGCATCT GT GT CT ACGT GAT C C CAGACGGAGAGACTC GCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I 
Db 549 AT CATT GGCAT CT GT GT CT AC GT GAT CC CAGAC GGAGAGACT C GCAAGAT CAAGCAT CTA 608 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 609 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 668 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



669 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 728 



Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 729 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 788 

Qy 781 AT G C AC AAAAAGT AC C G C AC AGAC AAAC AC C GAG G AAT TAT C AT AG AG AC AGAG GGT G AC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 789 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 848 

Qy 841 C AC C CTAAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAATT CC CATTTT CT AGATGGGAAC 900 

II I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 849 CAC C CTAAGGGCAT TGAGATGGAT GGGAAAAT GAT GAATT CCCATTTT CT AGAT GGGAAC 908 

Qy 901 CTGGTGCCC CT GGAAGGGAAGGAAGT GGAT GAGT CCCGC AGAGAGAT GAT CCGGATTCT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 909 CTGGT GCCC CT GGAAGGGAAGGAAGT GGAT GAGT C CCGCAGAGAGAT GAT CCGGATTCT C 968 

Qy 961 AAGGAT CT GAAGCAAAAACAC C CAGAGAAGGACTT AGAT CAGCTGGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 969 AAGGAT CT GAAGCAAAAACAC CCAGAGAAGGACTT AGAT CAGCTGGT GGAGAT GGCCAAT 1028 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1029 TACT AT GCT CTT T C CC ACCAACAGAAGAGC C GT GCCTT CT AC C GT AT C CAAGC CACTCGT 1088 

Qy 1081 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGC AGAACAAGC CAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1089 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGC AGAACAAGCCAAGAAGGCC 1148 

Qy 1141 T CC AGC AT GAGC GAGGT GCACAC CGAT GAGCCT GAGGACTTT ATT T CCAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I II I I I I I I I I I I I I I I I I I I I 

Db 1149 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1208 

Qy 1201 GAC C CAT GT T CT T ACC AGT GCCT GGAGAACT GT GGGGCT GT ACT C CT GACAGT GGT GAGG 1260 

I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1209 GAC C CAT GT T CTT ACCAGT GCCT GGAGAACT GT GGGGCT GT ACT C CT GACAGT GGT GAGG 1268 

Qy 1261 AAAGGGGGAGAC AT GT CAAAGACCAT GT AT GT GGACT AC AAAACAGAGGAT GGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1269 AAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT GGACT AC AAAACAGAGGAT GGTT CT GCC 1328 

Qy 1321 AAT GC AGGGGCT GACT AT GAGTT CACAGAGGGCACGGT GGTT CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1329 AAT GC AGGGGCT GACT AT GAGT T CACAGAGGGCACGGT GGTT CT GAAGCCAGGAGAGACC 1388 

Qy 1381 CAGAAGGAGTT CTCCGTGGGCATAATT GATGACGACATTTTT GAGGAGGATGAACACTTC 1440 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1389 CAGAAGGAGTT CT C CGT GGGC ATAATT GAT GACGACATTTTT GAGGAGGAT GAAC ACTT C 1448 

Qy 1441 TTT GT AAGGT T GAGCAAT GTC C GC AT AGAGGAGGAGCAGCCAGAGGAGGGGAT GC CT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1449 T TT GTAAGGTT GAGCAAT GTCCGCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GCCTC CA 1508 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1509 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1568 



Qy 1561 GTT ACC ATCTT GGAT GAT GAC CAT GCAGGCAT CTT CACTTTT GAAT GT GAT ACT ATTCAT 1620 

I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 1 I I I I I I 
Db 1569 GTTACCATCTTGGAT GAT GACCATGCAGGCATCTTCACTTTTGAATGT GAT ACT ATTCAT 1628 

Qy 1621 GTCAGT GAGAGTATTGGTGTTATGGAGGT CAAGGTTCTGCGGACATCAGGT GCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1629 GT C AGT GAGAGT ATT GGT GTT AT GGAGGT CAAGGT T CT GCGGAC ATC AGGT GCCCGGGGT 1688 

Qy 1681 ACAGTCATCGTC CCCT TT AGGACAGT AGAAGGGACAGC CAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1689 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1748 

Qy 1741 GAAGACACAT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACT GT 1784 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1749 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT 1792 



Search completed: January 22, 2005, 08:02:10 
Job time : 878.539 sees 



GenCore version 5.1.6 
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OM nucleic - nucleic search, using sw model 



Run on: 



Title: 

Perfect score: 
Sequence: 

Scoring table: 



Searched: 



January 22, 2005, 07:18:20 ; Search time 152.533 Seconds 

(without alignments) 
8681.377 Million cell updates/sec 



US-10-054-680-3 
1863 

1 atggcgtggttaaggttgca. 



. ggaaagccagtattgggtga 1863 



IDENTITY_NUC 

Gapop 10.0 , Gapext 1 . 0 



824507 seqs, 355394441 residues 
Total number of hits satisfying chosen parameters: 



1649014 



Minimum DB seq length: 
Maximum DB seq length: 



2000000000 



Post-processing: 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 

Database : Issued_Patents_NA: * 

1 : /cgn2_6/ptodata/l/ina/5A__COMB. seq: * 

2 : /cgn2_6/ptodata/l/ina/5B_COMB. seq: * 

3 : /cgn2_6/ptodata/l/ina/6A_COMB. seq: * 

4 : /cgn2_6/ptodata/l/ina/6B_COMB. seq: * 

5: /cgn2_6/ptodata/l/ina/PCTUS_COMB.seq:* 

6 : /cgn2_6/ptodata/l/ina/backfilesl . seq: * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 



SUMMARIES 



Result 



% 

Query 





No. 


Score 


Match Length DB 


ID 


Description 




1 


71.6 


3.8 


1935 


4 


US-09-701-068-3 


Sequence 


3, Appli 




2 


71.6 


3.8 


1950 


4 


US-09-701-068-1 


Sequence 


1, Appli 




3 


51.6 


2.8 


7218 


1 


US-08-232-463-14 


Sequence 


14, Appl 


c 


4 


51 


2.7 


7218 


1 


US-08-232-463-14 


Sequence 


14, Appl 




5 


44.8 


2.4 


2803 


4 


US-09-701-068-4 


Sequence 


4, Appli 




6 


38.4 


2.1 


160 


1 


US-08-182-175A-44 


Sequence 


44, Appl 




7 


38.4 


2.1 


160 


1 


US-08-474-633A-53 


Sequence 


53, Appl 




8 


38.4 


2.1 


160 


4 


US-08-823-771-53 


Sequence 


53, Appl 




9 


38.4 


2.1 


160 


5 


PCT-US92-06412-44 


Sequence 


44, Appl 


c 


10 


38.4 


2.1 


2777 


3 


US-09-310-463-3 


Sequence 


3, Appli 


c 


11 


38.4 


2.1 


2777 


4 


US-08-842-248A-3 


Sequence 


3, Appli 



c 


12 


37.4 


2.0 


289 


3 


US-09-007-005-17 


Sequence 


17, 


Appl 


c 


13 


37.4 


2.0 


289 


3 


US-09-244-796-17 


Sequence 


17, 


Appl 


c 


14 


37.2 


2.0 


1320 


4 


US-09-148-545-110 


Sequence 


110 


, App 




15 


37 


2.0 


740 


4 


US-09-270-767-31616 


Sequence 


31616, A 




16 


37 


2.0 


1600 


4 


US-09-270-767-15272 


Sequence 


15272, A 


c 


17 


37 


2.0 


1890 


3 


US-08-935-855-19 


Sequence 


19, 


APPI 




18 


36.8 


2.0 


160 


1 


US-08-182-175A-32 


Sequence 


32, 


Appl 




19 


36.8 


2.0 


160 


1 


US-08-182-175A-34 


Sequence 


34, 


Appl 




20 


36.8 


2.0 


160 


1 


US-08-474-633A-29 


Sequence 


29, 


Appl 




21 


36.8 


2.0 


160 


1 


US-08-474-633A-31 


Sequence 


31, 


Appl 




22 


36.8 


2.0 


160 


4 


US-08-823-771-29 


Sequence 


29, 


Appl 




23 


36.8 


2.0 


160 


4 


US-08-823-771-31 


Sequence 


31, 


Appl 




24 


36.8 


2.0 


160 


5 


PCT-US92-06412-32 


Sequence 


32, 


Appl 




25 


36.8 


2.0 


160 


5 


PCT-US92-06412-34 


Sequence 


34, 


Appl 




26 


36.8 


2.0 


187 


1 


US-08-182-175A-90 


Sequence 


90, 


Appl 




27 


36.8 


2.0 


187 


1 


US-08-474-633A-78 


Sequence 


78, 


Appl 




28 


36.8 


2.0 


187 


4 


US-08-823-771-78 


Sequence 


78, 


Appl 




29 


36.8 


2.0 


187 


5 


PCT-US92-06412-90 


Sequence 


90, 


Appl 


c 


30 


36.8 


2.0 


2790 


3 


US-08-985-950-21 


Sequence 


21, 


Appl 


c 


31 


36.8 


2.0 


2790 


4 


US-09-546-049-21 


Sequence 


21, 


Appl 


c 


32 


36.8 


2.0 


2922 


3 


US-09-310-463-1 


Sequence 


1, 


Appli 


c 


33 


36.8 


2.0 


2922 


4 


US-08-842-248A-1 


Sequence 




Appli 




34 


36.6 


2.0 


289 


3 


US-09-007-005-17 


Sequence 


17, 


Appl 




35 


36.6 


2.0 


289 


3 


US-09-244-796-17 


Sequence 


17, 


Appl 




36 


36 


1.9 


505 


4 


US-09-621-976-15639 


Sequence 


15639, A 


c 


37 


36 


1.9 


1312 


4 


US-10-140-002-397 


Sequence 


397, App 


c 


38 


36 


1.9 


1328 


4 


US-09-599-360B-46 


Sequence 


46, 


Appl 




39 


35.6 


1.9 


189 


3 


US-09-461-697-213 


Sequence 


213 


f App 




40 


35.6 


1.9 


195 


3 


US-09-4.61-697-211 


Sequence 


211 


, App 




41 


35.6 


1.9 


213 


3 


US-09-461-697-209 


Sequence 


209 


f App 




42 


35.6 


1.9 


231 


3 


US-09-461-697-207 


Sequence 


207 


, App 




43 


35.6 


1.9 


282 


3 


US-09-461-697-205 


Sequence 


205 


, App 




44 


35.6 


1.9 


306 


3 


US-09-461-697-203 


Sequence 


203 


r App 




45 


35.6 


1.9 


696 


3 


US-09-461-697-193 


Sequence 


193 


, App 



ALIGNMENTS 



RESULT 1 
US-09-701-068-3 

; Sequence 3, Application US/09701068 

; Patent No. 6677506 

; GENERAL INFORMATION: 

; APPLICANT: Galil, Gad et al. 

; TITLE OF INVENTION: DNA CODING FOR A Mg2+/H+ OR Zn2+/H+ EXCHANGER AND 
TRANSGENIC PLANTS 

; TITLE OF INVENTION: EXPRESSING SAME 
; FILE REFERENCE: 01/21317 

; CURRENT APPLICATION NUMBER: US/09/701,068 

; CURRENT FILING DATE: 2001-05-07 

; NUMBER OF SEQ ID NOS: 17 

; SOFTWARE: Patentln version 3.0 

; SEQ ID NO 3 

LENGTH: 1935 

TYPE: DNA 
; ORGANISM: Arabidopsis thaliana 



FEATURE : 
; NAME/ KEY: CDS 

LOCATION: ( 136) ..( 1755 ) 
US-09-701-068-3 

Query Match 3.8%; Score 71.6; DB 4; Length 1935; 

Best Local Similarity 48.2%; Pred. No. 6.4e-12; 

Matches 268; Conservative 0; Mismatches 279; Indels 9; Gaps 2 

Qy 226 AGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCT 285 

I I I I I I I I I I I I I I II III II I I I I I I I I I IN II 

Db 253 AGGGGTGTGTTATATTTTCTCGGTCTTGCCTACTGCTTTATTGGGTTGTCAGCCATCACT 312 

Qy 286 GAC C GCTT CAT GGCAT CT ATT G AAGTCAT CACCTCTCAAGAGAGGGAGGT GACAATT 342 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 313 GCAC GGTTCTTCAAGT CT ATGGAGAAT GTCGT GAAAC AT T C C CGTAAAGTGGT T ACAATT 372 

Qy 343 AAGAAACCCAAT GGAGAAACC AGCACAACCACT AT T C GGGT CTGGAATGAAACT GT CT CC 402 

I I I I I I I I I I I I I II I I I I I I I 

Db 373 GAT C C C ATT ACTAAAGCT GAAGT CAT CACAT ACAAGAAAGTT TGGAACTTT ACTAT T GCA 432 

Qy 403 AACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAG 462 

I I I I I I I I I III I I I I I I I I I II I I I I 

Db 433 GACATCAGTTTGTTGGCGTTTGGAACTAGCTTCCCTCAGATTTCTTTGGCTACCATCGAT 492 

Qy 463 GT GT GT GGT CAT GGGT TC ATT GCT GGT GAT CT GGGACCT T CT ACCATT GT AGGG 516 

I I II II I I I I I I I I I I I I I I I II I I I I I I 

Db 493 GCAATACGGAATATGGGGGAGCGGTATGCTGGAGGTCTTGGTCCTGGAACACTTGTTGGC 552 

Qy 517 AGTGCAGCCTTCAACATGTTCATCATCATTGGCATCTGTGTCTACGTGATCCCAGACGGA 576 

I I I I I I I I I I I I I I I I I I I II I I III II III 

Db 553 TCAGCTGCATTTGATCTTTTCCCCATCCACGCTGTTTGTGTCGTTGTGCCAAAAGCTGGA 612 

Qy 577 GAGACT C GCAAGAT CAAGCAT CTAC GAGT CT T CT T CAT CAC C GCT GCTTGGAGT AT CTTT 636 

II I I II I I I I I II I II I I II I I I 

Db 613 GAACTGAAAAAGATATCCGACTTAGGTGTTTGGCTAGTTGAGCTCGTATGGTCTTTTTGG 672 

Qy 637 GCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGG 696 

I I I I I I I I I I I I I I I I I I I I I I III I I I I II I II I 

Db 673 GCT T AC ATCT GGCTAT ACATAATC CT CGAGGT GT GGT CAC CAAAC GTAAT T AC ACTT GT G 732 

Qy 697 GAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGAT 756 

III I I I I I I I Ml I I III II I f III 

Db 733 GAGGCAT TAT TGACAGTACTGCAATACGGATT GCTT CTAGTT CAT GCGT AC GCCCAAGAC 792 

Qy 757 AAACGACTGCTCTTCT 772 

I I I I I II III 
Db 793 AAGCGATGGCCTTACT 808 



RESULT 2 
US-09-701-068-1 

; Sequence 1, Application US/09701068 

; Patent No. 6677506 

; GENERAL INFORMATION : 

; APPLICANT: Galil, Gad et al . 



; TITLE OF INVENTION: DNA CODING FOR A Mg2+/H+ OR Zn2+/H+ EXCHANGER AND 
TRANSGENIC PLANTS 

TITLE OF INVENTION: EXPRESSING SAME 
FILE REFERENCE: 01/21317 

CURRENT APPLICATION NUMBER: US/09/701,068 
CURRENT FILING DATE: 2001-05-07 
NUMBER OF SEQ ID NOS : 17 
SOFTWARE: Patentln version 3.0 
SEQ ID NO 1 
LENGTH: 1950 
TYPE: DNA 

ORGANISM: Arabidopsis thaliana 
US-09-701-068-1 

Query Match 3.8%; Score 71.6; DB 4; Length 1950; 

Best Local Similarity 48.2%; Pred. No. 6.4e-12; 

Matches 268; Conservative 0; Mismatches 279; Indels 9; Gaps 2; 

Qy 226 AGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCT 285 

I I I I I I I I I I I I I I II III II I I I I I I I I I III II 

Db 258 AGGGGTGTGTTATATTTTCTCGGTCTTGCCTACTGCTTTATTGGGTTGTCAGCCATCACT 317 

Qy 286 GACCGCTTCATGGCATCTATTG AAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAATT 342 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 318 GCACGGTT CTTCAAGT CTATGGAGAAT GTCGTGAAACATT CCCGTAAAGT GGTTACAATT 377 

Qy 343 AAGAAACCCAAT GGAGAAACCAGCACAACCACTATTCGGGTCTGGAAT GAAACTGTCTCC 402 

I I I II I I I I I I I I I I I I I I I I I 

Db 378 GAT C CC AT T ACTAAAGCT GAAGT CAT CACAT ACAAGAAAGTTT GGAACTTT ACT ATTGC A 437 

Qy 403 AACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAG 462 

II I I I I I I I III I I I I I I II I II I I I I 

Db 438 GACATCAGTTTGTTGGCGTTTGGAACTAGCTTCCCTCAGATTTCTTTGGCTACCATCGAT 497 

Qy 463 GTGTGTGGTCAT GGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGG 516 

I I II II I I I I I I I I I I I I I I I II I I I I I I 

Db 498 GCAATACGGAATATGGGGGAGCGGTATGCTGGAGGTCTTGGTCCTGGAACACTTGTTGGC 557 

Qy 517 AGT GCAGC CTT CAACAT GT T CAT CAT CATT GGC AT CT GT GT CT AC GT GAT C C CAGACGGA 576 

I I I I I I I I I I I I I I I I I I I I I I I III II III 

Db 558 TCAGCTGCATTTGATCTTTTCCCCATCCACGCTGTTTGTGTCGTTGTGCCAAAAGCTGGA 617 

Qy 577 GAGACT CGCAAGAT CAAGCAT CTACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTT 636 

II I I I I I I I I I I I I II I I I I I I I 

Db 618 GAACTGAAAAAGATATCCGACTTAGGTGTTTGGCTAGTTGAGCTCGTATGGTCTTTTTGG 677 

Qy 637 GCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGG 696 

I I I I I I I I I I I I I I I I I I I I I I III I I I I II I II I 

Db 678 GCTTACAT CTGGCTAT ACATAAT CCT CGAGGT GTGGTCACCAAACGTAATTACACTTGT G 737 

Qy 697 GAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGAT 756 

III I I I I I I I I I I I I I I I I I I I III 

Db 738 GAGGCATTATTGACAGTACTGCAATACGGATTGCTTCTAGTTCATGCGTACGCCCAAGAC 797 



Qy 

Db 



757 AAACGACTGCTCTTCT 772 

I I I I I II III 
798 AAGCGATGGCCTTACT 813 



RESULT 3 

US-08-232-463-14 

; Sequence 14, Application US/08232463 
; Patent No. 5670367 
; GENERAL INFORMATION: 

APPLICANT: DORNER, F. 
; APPLICANT: SCHEIFLINGER, F. 
; APPLICANT: FALKNER, F. G. 

TITLE OF INVENTION: RECOMBINANT FOWLPOX VIRUS 
NUMBER OF SEQUENCES: 52 
CORRESPONDENCE ADDRESS: 
; ADDRESSEE: Foley & Lardner 

; STREET: 1800 Diagonal Road, Suite 500 

; CITY: Alexandria 

STATE: VA 
; COUNTRY: USA 

; ZIP: 22313-0299 

COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 
SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 
; APPLICATION NUMBER: US/08/232,463 

FILING DATE: 
CLASSIFICATION: 435 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/07/935,313 
; FILING DATE: 

APPLICATION NUMBER: EP 91 114 300.6 
FILING DATE: 26-AUG-1991 
; ATTORNEY/AGENT INFORMATION: 
NAME: BENT, Stephen A. 
REGISTRATION NUMBER: 29,768 
REFERENCE/ DOCKET NUMBER: 30472/114 IMMU 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (703)836-9300 
; TELEFAX: (703)683-4109 

TELEX: 899149 
; INFORMATION FOR SEQ ID NO: 14: 

SEQUENCE CHARACTERISTICS: 
; LENGTH: 7218 base pairs 

; TYPE: nucleic acid 

STRANDEDNESS: single 
TOPOLOGY: linear 
IMMEDIATE SOURCE: 
CLONE: pTZgpt-Fls 
US-08-232-463-14 

Query Match 2.8%; Score 51.6; DB 1; Length 7218; 

Best Local Similarity 5.9%; Pred. No. 3.7e-05; 

Matches 24; Conservative 215; Mismatches 169; Indels 0; Gaps 0 



Qy 



395 CTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTT 454 



Db 1078 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 1137 

Qy 455 TAAT T GAGGT GT GT GGT CAT GGGTT CATT GCT GGT GAT CT GGGAC CTT CT ACCATT GTAG 514 

Db 1138 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 1197 

Qy 515 GGAGT GC AGC CT TCAACAT GTT CAT CAT CATT GGCAT CT GT GT CTAC GT GAT CCCAGAC G 574 



Db 1198 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 1257 

Qy 575 GAGAGACT CGCAAGAT CAAGCATCT AC GAGT CTT CTT CAT CACCGCT GCTT GGAGT ATCT 634 

Db 1258 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 1317 

Qy 635 TTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTT 694 

• • ••• • ••• •••• • • •••• • ••••••••••• • • • • • • • • 

• • ••• • ••• •••• • • • » . . • ••••••••••• • • ■ • • • • • 

Db 1318 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 1377 

Qy 695 GGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAG 754 

•»««..* **«..»»»»«»»».«• • • • ••••»•• • » » • 

••••••• .»••»•».»•».»»•• • • • ••«•»•» ••• • 

Db 1378 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYGTA 1437 

Qy 755 ATAAACGACT GCTCT T CT ACAAAT AC AT GC ACAAAAAGT ACCGCACAG 802 

III I III I I I I I I I I I I I I I I I I I 

Db 1438 CCAAATT CTT CTATCT CTTTAACTACTT GCATAGATAGGTAATTACAG 1485 



RESULT 4 

US-08-232-463-14/C 

; Sequence 14, Application US/08232463 

; Patent No. 5670367 

; GENERAL INFORMATION: 

APPLICANT: DORNER, F. 

APPLICANT: SCHEIFLINGER, F. 

APPLICANT: FALKNER, F. G. 

TITLE OF INVENTION: RECOMBINANT FOWLPOX VIRUS 
NUMBER OF SEQUENCES: 52 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Foley & Lardner 

STREET: 1800 Diagonal Road, Suite 500 
; CITY: Alexandria 

STATE: VA 

COUNTRY: USA 

ZIP: 22313-0299 
COMPUTER READABLE FORM: 

MEDIUM TYPE: . Floppy disk 
; COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/232,463 

FILING DATE: 

CLASSIFICATION: 435 
; PRIOR APPLICATION DATA: 
; APPLICATION NUMBER: US/07/935,313 

FILING DATE: 

APPLICATION NUMBER: EP 91 114 300.6 



FILING DATE: 26-AUG-1991 
ATTORNEY/ AGENT INFORMATION: 

NAME: BENT, Stephen A. 

REGISTRATION NUMBER: 29,768 

REFERENCE/ DOCKET NUMBER: 30472/114 IMMU 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (703)836-9300 

TELEFAX: (703)683-4109 

TELEX: 899149 
; INFORMATION FOR SEQ ID NO: 14: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 7218 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: single 
; TOPOLOGY: linear 

; IMMEDIATE SOURCE: 

CLONE: pTZgpt-Fls 
US-08-232-463-14 

Query Match 2.7%; Score 51; DB 1; Length 7218; 

Best Local Similarity 3.4%; Pred. No. 5.8e-05; 

Matches 9; Conservative 161; Mismatches 91; Indels 0; Gaps 0; 



Qy 1603 GAATGT GATACTATTCAT GT CAGT GAGAGT ATTGGTGTTATGGAGGTCAAGGTTCT GCGG 1662 

Iii i i) ill • * • ..... . .. . . ..... .... . . . • 

iii ii iii * * • • • ..... . .. . . ..... .... . .. 

Db 1445 GAATT T GGT AC RRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRR 1386 

Qy 1663 AC AT CAGGT GC C C GGGGT AC AGT CAT C GT C C C CT T T AGGAC AGT AGAAGGGACAGCCAAG 1722 

. . ... . .... . .. . . .... .. ........ .. ... 

. . ... . .... . .. . . .... .. ........ .. ... 

Db 1385 RRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRR 1326 

Qy 1723 GGT GGCGGT GAGGACT T T GAAGACACAT AT GGGGAGTTGGAATT CAAGAAT GAT GAAACT 1782 

.. .. .. ..... ..... . . . ...... .... ..... .. .... 

.. .. .. ..... ..... . . . ....... .... ..... .. .... 

Db 1325 RRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRR 1266 

Qy 1783 GT ATGT GAC AGACAGGAAGCT GACT AT GGAAGAAGAGGAGGCCAAGAGGAT AGCAGAGAT 1842 

Db 1265 RRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRR 1206 

Qy 1843 GGGAAAGCCAGTATTGGGTGA 1863 

....... .. . ... .. 

....... .. . ... . . 

Db 1205 RRRRRRRRRRRRRRRRRRRRR 1185 



RESULT 5 
US-09-701-068-4 

; Sequence 4, Application US/09701068 

; Patent No. 6677506 

; GENERAL INFORMATION: 

; APPLICANT: Galil, Gad et al . 

; TITLE OF INVENTION: DNA CODING FOR A Mg2+/H+ OR Zn2+/H+ EXCHANGER AND 
TRANSGENIC PLANTS 

; TITLE OF INVENTION: EXPRESSING SAME 
; FILE REFERENCE: 01/21317 

; CURRENT APPLICATION NUMBER: US/09/701, 068 
; CURRENT FILING DATE: 2001-05-07 
; NUMBER OF SEQ ID NOS : 17 



; SOFTWARE: Patentln version 3.0 

; SEQ ID NO 4 

; LENGTH: 2803 

; TYPE: DNA 

ORGANISM: Arabidopsis thaliana 
US-09-701-068-4 

Query Match 2.4%; Score 44.8; DB 4; Length 2803; 

Best Local Similarity 52.1%; Pred. No. 0.0028; 

Matches 100; Conservative 0; Mismatches 92; Indels 0; Gaps 0; 

Qy 477 GTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTT 536 

III I I I I I I I I I I I II I I I I I I I I I I I I I III 

Db 950 GTTTTGTCATATAGGTCTTGGTCCTGGAACACTTGTTGGCTCAGCTGCATTTGATCTTTT 1009 

Qy 537 CAT CAT CAT TGGCATCT GT GT CT ACGT GAT C C C AGAC GGAGAGACT CGCAAGAT CAAGCA 596 

I I I I I I I I I I I I I III II I I I I I I II I I I 

Db 1010 CCC C AT CCAC GCT GTTT GT GT CGTT GT GC CAAAAGCT GGAGAACT GAAAAAGAT AT CCGA 1069 

Qy 597 TCTACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATAT 656 

MINI I I I III III I I II I I II I I I I I I I I I 

Db 1070 CTTAGGTGTTTGGCTAGTTGAGCTCGTATGGTCTTTTTGGGCTTACATCTGGCTATACAT 1129 

Qy 657 GATTCTGGCAGT 668 

I I I I I II 
Db 1130 AAT C CT CGAGGT 1141 



RESULT 6 

US-08-182-175A-44 

; Sequence 44, Application US/08182175A 

; Patent No. 5559223 

; GENERAL INFORMATION: 

; APPLICANT: Saverio Carl Falco 

APPLICANT: Sharon J. Keeler 

APPLICANT: Janet A. Rice 

TITLE OF INVENTION: Synthetic Storage Proteins with Defined Structure 
Containing Pro 

NUMBER OF SEQUENCES: 113 
CORRESPONDENCE ADDRESS: 
; ADDRESSEE: E.I. du Pont de Nemours and Company 

STREET: 1007 Market Street 
; CITY: Wilmington 

STATE: Delaware 
; COUNTRY: USA 

ZIP: 19898 
; COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy Disk 
COMPUTER: Macintosh 

OPERATING SYSTEM: Macintosh System, 6.0 

SOFTWARE: Microsoft Word, 4.0 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/182, 175A 
; FILING DATE: 

CLASSIFICATION: 800 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/743,006 



FILING DATE: 9 August 1991 
ATTORNEY/ AGENT INFORMATION: 
NAME: Linda Axamethy Floyd 
REGISTRATION NUMBER: 33,692 
REFERENCE/DOCKET NUMBER: BB-1031 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (302) 992-4929 
TELEFAX: (302) 892-7949 
TELEX: 835420 
INFORMATION FOR SEQ ID NO: 44: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 160 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : double 
TOPOLOGY: linear 
MOLECULE TYPE: DNA (genomic) 
ORIGINAL SOURCE: 
STRAIN: E. coli 
CELL TYPE: DH5 alpha 
IMMEDIATE SOURCE: 

CLONE: 82-4 
FEATURE: 

NAME/ KEY: CDS 
LOCATION: 2.. 151 
OTHER INFORMATION 
OTHER INFORMATION 
OTHER INFORMATION 
OTHER INFORMATION 
US-08-182-175A-44 



/function= "synthetic storage protein 
/product= "protein" 
/gene= "ssp" 

/standard name= "7.7.7.7.7.7.5" 



Query Match 2.1%; Score 38.4; DB 1; Length 160; 

Best Local Similarity 53.3%; Pred. No. 0.042; 

Matches 81; Conservative 0; Mismatches 71; Indels 



0; Gaps 



0; 



Qy 1708 GAAGGGACAGCCAAGGGT GGCGGT GAGGACT TT GAAGACAC ATAT GGGGAGTT GGAAT TC 1767 

I I I I III I I I I III II I I I I I I I I I I III I 

Db 4 GGAGGAGAAGCT GAAGGCGAT GGAGGAGAAGCT GAAGGCGAT GGAGGAGAAGCT GAAGGC 63 



Qy 

Db 

Qy 

Db 



1768 AAGAAT GAT GAAACT GT AT GT GACAGACAGGAAGCT GACTAT GGAAGAAGAGGAGGCCAA 1827 
I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II 

64 GAT GGAGGAGAAGCT GAAGGCGAT GGAGGAGAAGCT GAAGGC GAT GGAGGAGAAGCT GAA 123 

1828 GAGGATAGCAGAGATGGGAAAGCCAGTATTGG 1859 
I I I I I I I I I I I I I I I I I I I 
124 GGCGAT GGAAGAGAAGAT GAAGGC GT GAT AGG 155 



RESULT 7 

US-08-474-633A-53 

; Sequence 53, Application US/08474633A 
; Patent No. 5773691 
; GENERAL INFORMATION: 

; APPLICANT: E. I. DU PONT DE NEMOURS AND 

; APPLICANT: COMPANY 

TITLE OF INVENTION: CHIMERIC GENES AND 
TITLE OF INVENTION: METHODS FOR INCREASING 
TITLE OF INVENTION: INCREASING THE LYSINE 



TITLE OF INVENTION: AND THREONINE CONTENT 
TITLE OF INVENTION: OF THE SEEDS OF PLANTS 
NUMBER OF SEQUENCES: 107 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: E. I. DU PONT DE NEMOURS 
ADDRESSEE: AND COMPANY 
STREET: 1007 MARKET STREET 
CITY: WILMINGTON 
STATE: DELAWARE 
COUNTRY: U.S.A. 
ZIP: 19898 
COMPUTER READABLE FORM: 

MEDIUM TYPE: FLOPPY DISK 
COMPUTER: IBM PC COMPATIBLE 
OPERATING SYSTEM: PC-DOS/MS-DOS 
SOFTWARE: MICROSOFT WORD VERSION 2 . 0C 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/474 , 633A 
FILING DATE: 
CLASSIFICATION: 800 
ATTORNEY/AGENT INFORMATION: 
NAME: BARBARA C. SIEGELL 
REGISTRATION NUMBER: 30,684 
REFERENCE/ DOCKET NUMBER: BB-1037-C 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: 302-992-4931 
TELEFAX: 302-773-0164 
TELEX: 835420 
INFORMATION FOR SEQ ID NO: 53: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 160 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : double 
TOPOLOGY: linear 
MOLECULE TYPE: DNA (genomic) 
ORIGINAL SOURCE: 
STRAIN: E. coli 
CELL TYPE: DH5 alpha 
IMMEDIATE SOURCE: 

CLONE: 82-4 
FEATURE : 

NAME/ KEY: CDS 
LOCATION: 2.. 151 

OTHER INFORMATION: /function= "synthetic 
OTHER INFORMATION: storage protein 
OTHER INFORMATION: /product= "protein" 
OTHER INFORMATION: /gene= "ssp" 
OTHER INFORMATION: / standard_name= 
OTHER INFORMATION: "7.7.7.7.7.7.5" 
US-08-474-633A-53 



Query Match 2.1%; Score 38.4; DB 1; Length 160; 

Best Local Similarity 53.3%; Pred. No. 0.042; 

Matches 81; Conservative 0; Mismatches 71; Indels 0; Gaps 0; 

Qy 1708 GAAGGGACAGCCAAGGGT GGC GGT GAGGACT TT GAAGACAC AT AT GGGGAGTTGGAATT C 1767 

I I I I III I I I I III II I I I I I I I I I I III I 



Db 



4 GGAGGAGAAGCT GAAGGC GAT GGAGGAGAAGCT GAAGGCGATGGAGGAGAAGCT GAAGGC 63 



Qy 



1768 AAGAAT GAT GAAACT GT AT GT GACAGAC AGGAAGCT GACTATGGAAGAAGAGGAGGCCAA 1827 



Db 



64 GAT GGAGGAGAAGCT GAAGGCGAT GGAGGAGAAGCT GAAGGCGATGGAGGAGAAGCT GAA 123 



Qy 



1828 GAGGATAGCAGAGAT GGGAAAGCCAGTATT GG 1859 



Db 



124 GGCGAT GGAAGAGAAGAT GAAGGCGT GAT AGG 155 



RESULT 8 

US-08-823-771-53 

; Sequence 53, Application US/08823771 
; Patent No. 6459019 

GENERAL INFORMATION: 



APPLICANT: E. I. DU PONT DE NEMOURS AND 



TITLE OF INVENTION: CHIMERIC GENES AND 



NUMBER OF SEQUENCES: 107 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: E. I. DU PONT DE NEMOURS 



STREET: 1007 MARKET STREET 

CITY: WILMINGTON 

STATE: DELAWARE 

COUNTRY: U.S.A. 

ZIP: 19898 
COMPUTER READABLE FORM: 

MEDIUM TYPE: FLOPPY DISK 

COMPUTER: IBM PC COMPATIBLE 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: MICROSOFT WORD VERSION 2 . 0C 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/823,771 

FILING DATE: 24-Mar-1997 

CLASSIFICATION: <Unknown> 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 08/474,633 

FILING DATE: <Unknown> 
ATTORNEY/AGENT INFORMATION: 

NAME: BARBARA C. SIEGELL 

REGISTRATION NUMBER: 30,684 

REFERENCE/ DOCKET NUMBER: BB-1037-C 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: 302-992-4931 

TELEFAX: 302-773-0164 

TELEX: 835420 
INFORMATION FOR SEQ ID NO: 53: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 160 base pairs 

TYPE: nucleic acid 

STRANDEDNESS: double 

TOPOLOGY: linear 



COMPANY 



METHODS FOR INCREASING 
INCREASING THE LYSINE 
AND THREONINE CONTENT 



AND COMPANY 



MOLECULE TYPE: DNA (genomic) 
ORIGINAL SOURCE: 

STRAIN: E. coli 

CELL TYPE: DH5 alpha 
IMMEDIATE SOURCE: 

CLONE: 82-4 
FEATURE : 

NAME/ KEY: CDS 

LOCATION: 2.. 151 

OTHER INFORMATION: /function^ "synthetic 
; storage protein 

; /product= "protein" 

; /gene= "ssp" 

; /standard_name= 
; "7.7.7.7.7.7.5" 

SEQUENCE DESCRIPTION: SEQ ID NO: 53: 
US-08-823-771-53 

Query Match 2.1%; Score 38.4; DB 4; Length 160; 

Best Local Similarity 53.3%; Pred. No. 0.042; 

Matches 81; Conservative 0; Mismatches 71; Indels 0; Gaps 0; 

Qy 1708 GAAGGGAC AGC CAAGGGT GGC GGT GAGGACTTT GAAGACACAT AT GGGGAGTTGGAATT C 1767 

I Ml III I I I I III II I I I I I I II I I III I 

Db 4 GGAGGAGAAGCTGAAG GC GAT GGAGGAGAAGCT GAAGGCGATGGAGGAGAAGCT GAAGGC 63 

Qy 1768 AAGAAT GATGAAACT GT AT GT GACAGACAGGAAGCT GACT ATGGAAGAAGAGGAGGC CAA 1827 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II 

Db 64 GATGGAGGAGAAGCTGAAGGCGATGGAGGAGAAGCTGAAGGCGATGGAGGAGAAGCTGAA 123 

Qy 1828 GAGGAT AGCAGAGAT GGGAAAGCCAGTATTGG 1859 

I I I I I I I I I I I I I I I I I I I 
Db 124 GGC GAT GGAAGAGAAGAT GAAGGCGT GAT AGG 155 



RESULT 9 

PCT-US92-06412-44 

; Sequence 44 , Application PC/TUS9206412 
; GENERAL INFORMATION: 
; APPLICANT: Saverio Carl Falco 
; APPLICANT: Sharon J. Keeler 
APPLICANT: Janet A. Rice 

TITLE OF INVENTION: Synthetic Storage Proteins with Defined Structure 
Containing Pro 

NUMBER OF SEQUENCES: 113 
CORRESPONDENCE ADDRESS: 
; ADDRESSEE: E.I. du Pont de Nemours and Company 

STREET: 1007 Market Street 
; CITY: Wilmington 

; STATE: Delaware 

; COUNTRY: USA 

ZIP: 19898 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy Disk 
COMPUTER: Macintosh 
; OPERATING SYSTEM: Macintosh System, 6.0 

; SOFTWARE: Microsoft Word, 4.0 



CURRENT APPLICATION DATA: 

APPLICATION NUMBER: PCT/US92/06412 
FILING DATE: 19920807 
CLASSIFICATION: 530 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 07/743,006 
FILING DATE: 9 August 1991 
ATTORNEY/AGENT INFORMATION: 
NAME: Linda Axamethy Floyd 
REGISTRATION NUMBER: 33,692 
REFERENCE/ DOCKET NUMBER: BB-1031 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (302) 992-4929 
TELEFAX: (302) 892-7949 
TELEX: 835420 
INFORMATION FOR SEQ ID NO: 44: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 160 base pairs 
TYPE: NUCLEIC ACID 
STRANDEDNESS : double 
TOPOLOGY: linear 
MOLECULE TYPE: DNA (genomic) 
ORIGINAL SOURCE: 
STRAIN: E. coli 
CELL TYPE: DH5 alpha 
IMMEDIATE SOURCE: 

CLONE: 82-4 
FEATURE : 

NAME/ KEY: CDS 
LOCATION: 2. -151 

OTHER INFORMATION: /function^ "synthetic storage protein 
OTHER INFORMATION: /product= "protein" 
OTHER INFORMATION: /gene= "ssp" 

OTHER INFORMATION: /standard_name= "7.7.7.7.7.7.5" 
PCT-US92-06412-44 

Query Match 2.1%; Score 38.4; DB 5; Length 160; 

Best Local Similarity 53.3%; Pred. No. 0.042; 

Matches 81; Conservative 0; Mismatches 71; Indels 0; Gaps 0; 

Qy 1708 GAAGGGACAGC CAAGGGT GGC GGT GAGGACTTT GAAGACACAT AT GGGGAGTT GGAATT C 1767 

I I I I III I I I I III II I I I I I I I I I I III I 

Db 4 GGAGGAGAAGCT GAAGGC GAT GGAGGAGAAGCT GAAGGC GAT GGAGGAGAAGCT GAAGGC 63 

Qy 1768 AAGAAT GAT GAAACT GT AT GT GACAGACAGGAAGCT GACT AT GGAAGAAGAGGAGGCCAA 1827 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II 

Db 64 GAT GGAGGAGAAGCT GAAGGC GAT GGAGGAGAAGCT GAAGGCGAT GGAGGAGAAGCTGAA 123 

Qy 1828 GAGGATAGCAGAGAT GGGAAAGCCAGT ATT GG 1859 

I I I I I I I I I I I II I I I I I I 
Db 124 GGC GAT GGAAGAGAAGAT GAAGGC GT GAT AGG 155 



RESULT 10 
US-09-310-463-3/C 

; Sequence. 3, Application US/09310463A 
; Patent No. 6384203 



; GENERAL INFORMATION: 
; APPLICANT: Cosman, David J. 
; APPLICANT: Anderson, Dirk M. 
; APPLICANT: Borges, Luis 

; TITLE OF INVENTION: Family of Immuno regulators Designated Leukocyte 
Immunoglobulin- 

; TITLE OF INVENTION: Like Receptors (LIR) 
; FILE REFERENCE: 2624-A 

; CURRENT APPLICATION NUMBER: US/09/310, 463A 

; CURRENT FILING DATE: 1999-05-12 

; EARLIER APPLICATION NUMBER: 08/842,248 

; EARLIER FILING DATE: 1997-04-24 

; NUMBER OF SEQ ID NOS: 39 

; SOFTWARE: Patentln Ver. 2.0 

; SEQ ID NO 3 

; LENGTH: 2777 

; TYPE: DNA 

; ORGANISM: human 

FEATURE: 
; NAME/ KEY: CDS 
; LOCATION: (168) (2126) 
US-09-310-463-3 

Query Match 2.1%; Score 38.4; DB 3; Length 2777; 

Best Local Similarity 49.0%; Pred. No. 0.31; 

Matches 102; Conservative 0; Mismatches 106; Indels 0; Gaps 0; 



Qy 1303 ACAGAGGAT GGTT CTGC CAAT GCAGGGGCT GACT ATGAGTT CACAGAGGGCACGGT GGTT 1362 

I I I I I I I I I I I I II I I I II I I I I I I I I I I III 

Db 280 ACAGAGCCTGGTTCAGCCCAGAGGGTGGGCTTGGGGAGGTGCCCTGCCTGCACGTGGGTC 221 

Qy 1363 CTGAAGCC AGGAGAGACC CAGAAGGAGTT CT C CGT GGGCATAATT GAT GAC GACATTTT T 1422 

I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 220 CTGGGGCC CAGACT CAGC C CGAGACAGAT C AGGACCGT GAGGAT GGGGGT CAT GGCGT CT 161 

Qy 1423 GAGGAGGAT GAACACTT CTT T GTAAGGTT GAGCAATGT C C GCATAGAGGAGGAGC AGCCA 1482 

II I I I I I I I I I I I I I I I II I I I I I I III 

Db 160 CCTCCCACTGCCCTGCTCTGTGGATGGATGAGCCCTCGGTGCATGGCAGTCGTCCCTCCA 101 

Qy 1483 GAGGAGGGGATGCCTCCAGCAATATTCA 1510 

I I I I I I I I I I I I I I II 

Db 100 GC C CT GGAGAT GCTT C AGGGAAGACCCA 73 



RESULT 11 

US-08-842-248A-3/C 

; Sequence 3, Application US/08842248A 

; Patent No. 6448035 

; GENERAL INFORMATION: 

; APPLICANT: Cosman, David J. 

; TITLE OF INVENTION: Family of Immunoregulators Designated 

; TITLE OF INVENTION: Leukocyte Immunoglobulin- Like Receptors (LIR) 

NUMBER OF SEQUENCES: 29 

CORRESPONDENCE ADDRESS: 
; ADDRESSEE: Janis C. Henry, Immunex Corporation 

; • STREET: 51 University Street 

CITY: Seattle 



STATE: WA 
; COUNTRY: US 

ZIP: 98101 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM/ PC Compatible 

OPERATING SYSTEM: Microsoft Word 7.0 
; SOFTWARE: Patentln Release #1.0, Version #1.25 

; CURRENT APPLICATION DATA: 
; APPLICATION NUMBER: US/08/842 , 248A 

; FILING DATE: April 24, 1997 

CLASSIFICATION: 536 
; ATTORNEY/AGENT INFORMATION: 
; NAME: Henry, Janis C. 

REGISTRATION NUMBER: 34,347 
; REFERENCE/ DOCKET NUMBER: 2624 

; TELECOMMUNICATION INFORMATION: 
; TELEPHONE: (206) 587-0430 

; TELEFAX: (206) 233-0644 

TELEX: 756822 
; INFORMATION FOR SEQ ID NO: 3: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 2777 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: single 

TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
; IMMEDIATE SOURCE: 

; LIBRARY: 18a3 

FEATURE: 

NAME/KEY: CDS 

LOCATION: 168.. 2123 
US-08-842-248A-3 

Query Match 2.1%; Score 38.4; DB 4; Length 2777; 

Best Local Similarity 49.0%; Pred. No. 0.31; 

Matches 102; Conservative 0; Mismatches 106; Indels 0; Gaps 0; 

Qy 1303 ACAGAGGAT GGTT CT GCCAAT GCAGGGGCT GACT AT GAGTT C ACAGAGGGC ACGGT GGT T 1362 

I I I I I I I I I I I I I I I I III I I I I I I I I I I I II 

Db 280 ACAGAGCCTGGTTCAGCCCAGAGGGTGGGCTTGGGGAGGTGCCCTGCCTGCACGTGGGTC 221 

Qy 1363 CTGAAGCCAGGAGAGACC C AGAAGGAGT T CT CCGT GGGC AT AATT GAT GACGACATTTTT 1422 

I I I I I I I I Mill I I I I I I I I I I I II 

Db 220 CT GGGGCCCAGACTCAGCCCGAGACAGAT CAGGACC GT GAGGAT GGGGGT CAT GGCGT CT 161 

Qy 1423 GAGGAGGAT GAAC ACTT CT TT GT AAGGTT GAGCAAT GT CC GCATAGAGGAGGAGCAGCC A 1482 

II I I I I II I I I I I I I I I I I I I I I I I III 

Db 160 CCTCCCACTGCCCTGCTCTGTGGATGGATGAGCCCTCGGTGCATGGCAGTCGTCCCTCCA 101 

Qy 1483 GAGGAGGGGAT GCCT CCAGCAAT AT TC A 1510 

I I I I I I I I I I I I I I I I 

Db 100 GCCCT GGAGATGCTT CAGGGAAGAC C C A 73 



RESULT 12 

US-09-007-005-17/C 



; Sequence 17, Application US/09007005B 

; Patent No. 6258558 

; GENERAL INFORMATION: 

; APPLICANT: Szostak, Jack W. 

; APPLICANT: Roberts, Richard W. 

; APPLICANT: Liu, Rihe 

; TITLE OF INVENTION: SELECTION OF PROTEINS USING RNA- PROTEIN 

; TITLE OF INVENTION: FUSIONS 

; FILE REFERENCE: 00786/350003 

; CURRENT APPLICATION NUMBER: US/09/007 , 005B 

; CURRENT FILING DATE: 1998-01-14 

; EARLIER APPLICATION NUMBER: 60/035,963 

; EARLIER FILING DATE: 1997-01-27 

; EARLIER APPLICATION NUMBER: 60/064,491 

; EARLIER FILING DATE: 1997-11-06 

; NUMBER OF SEQ ID NOS : 33 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 17 

LENGTH: 289 

TYPE: RNA 
; ORGANISM: Artificial Sequence 
; FEATURE: 

OTHER INFORMATION: Translation template 
; FEATURE: 

; NAME/ KEY : misc_f eature 

LOCATION: (1) . . . (289) 

OTHER INFORMATION: n = A,T,C or G 
US-09-007-005-17 

Query Match 2.0%; Score 37.4; DB 3; Length 289; 

Best Local Similarity 6.5%; Pred. No. 0.13; 

Matches 14; Conservative 93; Mismatches 108; Indels 0; Gaps 0 

Qy 608 T CTT CAT C ACC GCT GCT T GGAGTAT CTTT GCCT AC AT CT GGCT CT AT ATGATT CT GGCAG 667 

.|.|* .. . . . . . ... . ... . ... ... . .. . • . 

.|.|. .. . . . * . ... . ... . ... ... . .. . .. 

Db 225 YCYTYGYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYN 166 

Qy 668 TCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAG 727 

........ ... .. .............. 

........ ... .. .............. 

Db 165 YSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYN 106 

Qy 728 T GT GT GT C CTT CT GGC CT GGGT GGCAGAT AAAC GACT GCT CTT CT ACAAAT AC AT GCACA 787 

......•*.. . » . • . «»»»•».« •(•••* 

**.*»*•*.. . . * a . •»•*•••» . | * • • • 

Db 105 YSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYCYAYTYTYGYT 46 

Qy 788 AAAAGT ACC GCAC AGACAAACACC GAGGAATT AT C 822 

III : I : : I I : I : I : I : I I : 

Db 45 YAYAYT YT YG YT YAYAYAYT YAYG YT YAYAYT YT Y 11 



RESULT 13 

US-09-244-796-17/C 

; Sequence 17, Application US/09244796 

; Patent No. 6281344 

; GENERAL INFORMATION: 

; APPLICANT: Szostak, Jack W. 

; APPLICANT: Roberts, Richard W. 



; APPLICANT: Liu, Rihe 

; TITLE OF INVENTION: SELECTION OF PROTEINS USING RNA- PROTEIN 

; TITLE OF INVENTION: FUSIONS 

; FILE REFERENCE: 00786/350007 

; CURRENT APPLICATION NUMBER: US/09/244,796 

; CURRENT FILING DATE: 1999-02-05 

; EARLIER APPLICATION NUMBER: 60/035,963 

; EARLIER FILING DATE: 1997-01-27 

; EARLIER APPLICATION NUMBER: 60/064,491 

; EARLIER FILING DATE: 1997-11-06 

; EARLIER APPLICATION NUMBER: 09/007,005 

; EARLIER FILING DATE: 1998-01-14 

; NUMBER OF SEQ ID NOS : 33 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 17 

LENGTH: 289 

TYPE: RNA 
; ORGANISM: Artificial Sequence 
; FEATURE: 

OTHER INFORMATION: Translation template 

FEATURE: 

NAME/KEY: misc_feature 
LOCATION: (1) . . . (289) 
OTHER INFORMATION: n = A,T,C or G 
US-09-244-796-17 

Query Match 2.0%; Score 37.4; DB 3; Length 289; 

Best Local Similarity 6.5%; Pred. No. 0.13; 

Matches 14; Conservative 93; Mismatches 108; Indels 0; Gaps 0 
Qy 608 T CT T CATCAC C GCT GCTT GGAGT AT CTTT GC CT ACAT CT GGCT CT AT ATGATT CT GGCAG 667 

.1.1. .. ■ • . . . ... . ... . ... ... a . . . . a 

. I . I . a. a a a . . ... . ... . ... aaa a aa . .. 

Db 225 YCYTYGYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYN 166 

Qy 668 TCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAG 727 



Db 165 YSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYN 106 

Qy 728 TGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATACATGCACA 787 

.......... . . . . . ........ .!««.» 

..«•....». . . . . . ........ »|«... 

Db 105 YSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYSYNYNYCYAYTYTYGYT 46 

Qy 788 AAAAGT AC C GC ACAGACAAACACC GAGGAATT AT C 822 

III : I : : I I : I : I : I : I I : 

Db 45 YAYAYT YT YG YT YAYAYAYT YAYG YT YAYAYT YT Y 11 



RESULT 14 

US-09-148-545-110/C 

; Sequence 110, Application US/09148545 

; Patent No. 6590075 

; GENERAL INFORMATION: 

; APPLICANT: Rosen et al . 

; TITLE OF INVENTION: 70 Human Secreted Proteins 
; FILE REFERENCE: PZ001P1 

; CURRENT APPLICATION NUMBER: US/09/148,545 
; CURRENT FILING DATE: 1998-09-04 
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EARLIER APPLICATION 



NUMBER: PCT/US98/04482 

1998-03-06 
NUMBER: 60/040,162 

1997-03-07 
NUMBER: 60/040,333 

1997-03-07 
NUMBER: 60/038,621 

1997-03-07 
NUMBER: 60/040,161 

1997-03-07 
NUMBER: 60/040,626 

1997-03-07 
NUMBER: 60/040,334 

1997-03-07 
NUMBER: 60/040,336 

1997-03-07 
NUMBER: 60/040,163 

1997-03-07 
NUMBER: 60/047,615 

1997-05-23 
NUMBER: 60/047,600 

1997-05-23 
NUMBER: 60/047,597 

1997-05-23 
NUMBER: 60/047,502 

1997-05-23 
NUMBER: 60/047,633 

1997-05-23 
NUMBER: 60/047,583 

1997-05-23 
NUMBER: 60/047,617 

1997-05-23 
NUMBER: 60/047,618 

1997-05-23 
NUMBER: 60/047,503 

1997-05-23 
NUMBER: 60/047,592 

1997-05-23 
NUMBER: 60/047,581 

1997-05-23 
NUMBER: 60/047,584 

1997-05-23 
NUMBER: 60/047,500 

1997-05-23 
NUMBER: 60/047,587 

1997-05-23 
NUMBER: 60/047,492 

1997-05-23 
NUMBER: 60/047,598 

1997-05-23 
NUMBER: 60/047,613 

1997-05-23 
NUMBER: 60/047,582 

1997-05-23 
NUMBER: 60/047,596 

1997-05-23 
NUMBER: 60/047,612 



EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,632 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/047,601 
EARLIER FILING DATE: 1997-05-23 
EARLIER APPLICATION NUMBER: 60/043,580 
EARLIER FILING DATE: 1997-04-11 
EARLIER APPLICATION NUMBER: 60/043,568 
EARLIER FILING DATE: 1997-04-11 
EARLIER APPLICATION NUMBER: 60/043,314 
EARLIER FILING DATE: 1997-04-11 
EARLIER APPLICATION NUMBER: 60/043,569 
EARLIER FILING DATE: 1997-04-11 
EARLIER APPLICATION NUMBER: 60/043,311 
EARLIER FILING DATE: 1997-04-11 
EARLIER APPLICATION NUMBER: 60/043,671 
EARLIER FILING DATE: 1997-04-11 
EARLIER APPLICATION NUMBER: 60/043,674 
EARLIER FILING DATE: 1997-04-11 
EARLIER APPLICATION NUMBER: 60/043,669 
EARLIER FILING DATE: 1997-04-11 
EARLIER APPLICATION NUMBER: 60/043,312 
EARLIER FILING DATE: 1997-04-11 
EARLIER APPLICATION NUMBER: 60/043,313 
EARLIER FILING DATE: 1997-04-11 
EARLIER APPLICATION NUMBER: 60/043,672 
EARLIER FILING DATE: 1997-04-11 
EARLIER APPLICATION NUMBER: 60/043,315 
EARLIER FILING DATE: 1997-04-11 
EARLIER APPLICATION NUMBER: 60/048,974 
EARLIER FILING DATE: 1997-06-06 
EARLIER APPLICATION NUMBER: 60/056,886 
EARLIER FILING DATE: 1997-08-22 
EARLIER APPLICATION NUMBER: 60/056,877 
EARLIER FILING DATE: 1997-08-22 
EARLIER APPLICATION NUMBER: 60/056,889 
EARLIER FILING DATE: 1997-08-22 
EARLIER APPLICATION NUMBER: 60/056,893 
EARLIER FILING DATE: 1997-08-22 
EARLIER APPLICATION NUMBER: 60/056,630 
EARLIER FILING DATE: 1997-08-22 
EARLIER APPLICATION NUMBER: 60/056,878 
EARLIER FILING DATE: 1997-08-22 
EARLIER APPLICATION NUMBER: 60/056,662 
EARLIER FILING DATE: 1997-08-22 
EARLIER APPLICATION NUMBER: 60/056,872 
EARLIER FILING DATE: 1997-08-22 
EARLIER APPLICATION NUMBER: 60/056,882 
EARLIER FILING DATE: 1997-08-22 
EARLIER APPLICATION NUMBER: 60/056,637 
EARLIER FILING DATE: 1997-08-22 
EARLIER APPLICATION NUMBER: 60/056,903 
EARLIER FILING DATE: 1997-08-22 
EARLIER APPLICATION NUMBER: 60/056,888 
EARLIER FILING DATE: 1997-08-22 
EARLIER APPLICATION NUMBER: 60/056,879 
EARLIER FILING DATE: 1997-08-22 
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EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 
EARLIER FILING DATE 
EARLIER APPLICATION 



NUMBER: 60/056,880 
: 1997-08-22 

NUMBER: 60/056,894 
: 1997-08-22 

NUMBER: 60/056,911 
: 1997-08-22 

NUMBER: 60/056,636 
: 1997-08-22 

NUMBER: 60/056,874 
: 1997-08-22 

NUMBER: 60/056,910 
: 1997-08-22 

NUMBER: 60/056,864 
: 1997-08-22 

NUMBER: 60/056,631 
: 1997-08-22 

NUMBER: 60/056,845 
: 1997-08-22 

NUMBER: 60/056,892 
: 1997-08-22 

NUMBER: 60/047,595 
: 1997-05-23 

NUMBER: 60/057,761 
: 05-Sep-1997 

NUMBER: 60/047,599 
: 1997-05-23 

NUMBER: 60/047,588 
: 1997-05-23 

NUMBER: 60/047,585 
: 1997-05-23 

NUMBER: 60/047,586 
: 1997-05-23 

NUMBER: 60/047,590 
: 1997-05-23 

NUMBER: 60/047,594 
: 1997-05-23 

NUMBER: 60/047,589 
: 1997-05-23 

NUMBER: 60/047,593 
: 1997-05-23 

NUMBER: 60/047,614 
: 1997-05-23 

NUMBER: 60/043,578 
: 1997-04-11 

NUMBER: 60/043,576 
: 1997-04-11 

NUMBER: 60/047,501 
: 1997-05-23 

NUMBER: 60/043,670 
: 1997-04-11 

NUMBER: 60/056,632 
: 1997-08-22 

NUMBER: 60/056,664 
: 1997-08-22 

NUMBER: 60/056,876 
: 1997-08-22 

NUMBER: 60/056,881 



; EARLIER FILING DATE: 1997-08-22 

; EARLIER APPLICATION NUMBER: 60/056,909 

; EARLIER FILING DATE: 1997-08-22 

; EARLIER APPLICATION NUMBER: 60/056,875 

; EARLIER FILING DATE: 1997-08-22 

; EARLIER APPLICATION NUMBER: 60/056,862 

; EARLIER FILING DATE: 1997-08-22 

; EARLIER APPLICATION NUMBER: 60/056,887 

; EARLIER FILING DATE: 1997-08-22 

; EARLIER APPLICATION NUMBER: 60/056,908 

; EARLIER FILING DATE: 1997-08-22 

; EARLIER APPLICATION NUMBER: 60/048,964 

; EARLIER FILING DATE: 1997-06-06 

; EARLIER APPLICATION NUMBER: 60/057,650 

; EARLIER FILING DATE: 1997-09-05 

; EARLIER APPLICATION NUMBER: 60/056,884 

; EARLIER FILING DATE: 1997-08-22 

; NUMBER OF SEQ ID NOS : 280 

; SOFTWARE: Patentln Ver. 2.0 

; SEQ ID NO 110 

; LENGTH: 1320 

Query Match 2.0%; Score 37.2; DB 4; Length 1320; 

Best Local Similarity 47.7%; Pred. No. 0.44; 

Matches 105; Conservative 1; Mismatches 114; Indels . 0; Gaps 0 

Qy 554 GTGTCTACGTGAT CCCAGACGGAGAGACTCGCAAGATCAAGCATCTACGAGTCTTCTT CA 613 

I I I I I I I I I I I I I I I I I Mill I II I II 

Db 810 GTGT CAC CGT CAT C C CAGCCAC GGCTGCT C GC C C C AGGT GACAGT GT GGC AGCT GAAGT C 751 

Qy 614 TCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCT 673 

I I I I I I I I I I I I I I II I I I I I I I I II 

Db 750 TCCCGGCTGCCAGGGCTCACTTCCAAGCTTACAGAACTCGTGTCACTCATTGTGTCAGCT 691 

Qy 674 CCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTG 733 

II II I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 690 CCTGTGCCATCCACCTGGGTGTCAATGGCCTCCACAAGCCCCCGCCATTTCCACTCTGTC 631 

Qy 734 TCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTA 773 

I I I I I I III III 1111:111 

Db 630 TCCTTCATCTCAGGCACATAGAAGTCTCCCTGCCSTGCCA 591 



RESULT 15 

US-09-270-767-31616 

; Sequence 31616, Application US/09270767 

; Patent No. 6703491 

; GENERAL INFORMATION: 

; APPLICANT: Homburger et al . 

; TITLE OF INVENTION: Nucleic acids and proteins of Drosophila melanogaster 
; FILE REFERENCE: File Reference: 7326-094 
; CURRENT APPLICATION NUMBER: US/09/270,767 
; CURRENT FILING DATE: 1999-03-17 
; NUMBER OF SEQ ID NOS: 62517 
; SOFTWARE: Patentln Ver. 2.0 
; SEQ ID NO 31616 
LENGTH: 740 



TYPE: DNA 

; ORGANISM: Drosophila melanogaster 
US-09-270-767-31616 

Query Match 2.0%; Score 37; DB 4; Length 740; 

Best Local Similarity 47.6%; Pred. No. 0.34; 

Matches 109; Conservative 0; Mismatches 120; Indels 0; Gaps 0; 



Qy 848 AGGGCATT GAGATGGAT GGGAAAAT GAT GAAT T C CCATT T T CT AGAT GGGAACCT GGT GC 907 

I I I I I I I I I I III II I I I I II I I I I I I I I 

Db 18 AGGACATCGAGGGCAACTGGCACCAGAAACAT CCCGTTGT GATGCAGTGCTTCCAGGAGT 77 

Qy 908 C C CT GGAAGGGAAGGAAGT GGAT GAGT C CCGCAGAGAGAT GAT C CGGATT CT CAAGGAT C 967 

III I I I I I I I I I I I I I I II I I I I I 

Db 78 T CAAGAAGAAGGACAAGGGCAT CGAGTATAACAAGGAGT GGGAT C GCGAGC GCAT C GAAA 137 

Qy 968 T GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGTGGAGATGGCCAATTACTATG 1027 

I I I III III II I I I I I I I I I I I II I I I I I I I 

Db 138 AGTACCGAAAT GTGGTCGAGGGCGAGGAAGAT CCCACGGAGGAGTT GGTGGAATACGAGG 197 

Qy 1028 CT CTTT C CC AC CAAC AGAAGAGCCGC GCCTT CTAC C GTAT C CAAGC CAC 1076 

II I I I II I I I I I I I I I I I I I I I I I I 
Db 198 T C GACGACC CTAAGCAGAAGAAGT GGGACT GC GAGT CTATC CTGT C CAC 246 



Search completed: January 22, 2005, 17:35:38 
Job time : 154.533 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2005 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



January 22, 2005, 07:25:49 ; Search time 985.631 Seconds 

(without alignments) 
10860.644 Million cell updates/sec 

US-10-054-680-3 
1863 

1 atggcgtggttaaggttgca ggaaagccagtattgggtga 1863 

IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 



4300275 seqs, 2872944193 residues 



Total number of hits satisfying chosen parameters: 



8600550 



Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



Post-processing: 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 



Database 



Published_Applications_NA: * 

1: /cgn2_6/ptodata/2/pubpna/US07_PUBCOMB.seq:* 

2 : /cgn2_6/ptodata/2/pubpna/PCT_NEW_PUB. seq: * 

3 : /cgn2_6/ptodata/2/pubpna/US06_NEW_PUB. seq: * 

4: /cgn2_6/ptodata/2/pubpna/US06_PUBCOMB.seq:+ 

5: /cgn2_6/ptodata/2/pubpna/US07_NEW_PUB. seq: * 

6: /cgn2_6/ptodata/2/pubpna/PCTUS_PUBCOMB.seq: 

7 : /cgn2_6/ptodata/2/pubpna/US08_NEW_PUB. seq: * 

8: /cgn2_6/ptodata/2/pubpna/US08_PUBCOMB.seq: * 

9: /cgn2_6/ptodata/2/pubpna/US09A_J>UBCOMB.seq: 

10 : /cgn2_6/ptodata/2/pubpna/US09B_PUBCOMB. seq 

11 : /cgn2_6/ptodata/2/pubpna/US09C_PUBCOMB. seq 

12 : /cgn2_6/ptodata/2/pubpna/US09_NEW_PUB. seq 

13: / cgn2_6/p t odata/2 /pubpna/US 1 0A_PUBCOMB . s eq 

14: /cgn2_6/ptodata/2/pubpna/US10B_PUBCOMB.seq 

15: / cgn2_6/p t oda ta/ 2 /pubpna/US 1 0C_PUBCOMB . s eq 

16: / cgn2_6/ptodata/ 2 /pubpna/US 1 0D_PUBCOMB . seq 

17: /cgn2_6/ptodata/2/pubpna/US10E_PUBCOMB.seq 

18 : /cgn2_6/ptodata/2/pubpna/US10_NEW_PUB. seq: 

19: /cgn2_6/ptodata/2/pubpna/USll_NEW_PUB.seq: 

20: /cgn2_6/ptodata/2/pubpna/US60_NEW_PUB.seq: 

21: /cgn2_6/ptodata/2/pubpna/US60_PUBCOMB.seq: 
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Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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ALIGNMENTS 

RESULT 1 
US-10-054-680-3 

Sequence 3, Application US/10054680 



; Publication No. US20020132998A1 
; GENERAL INFORMATION: 
; APPLICANT: Friddle, Carl Johan 
; APPLICANT: Hilbun, Erin 

; TITLE OF INVENTION: No. US20020132998Alel Human Ion Exchanger Proteins and 

Polynucleotides Encoding the 

; TITLE OF INVENTION: Same 

; FILE REFERENCE: LEX-0301-USA 

; CURRENT APPLICATION NUMBER: US/10/054,680 

; CURRENT FILING DATE: 2002-01-22 

; PRIOR APPLICATION NUMBER: US 60/263,384 

; PRIOR FILING DATE: 2001-01-23 

; NUMBER OF SEQ ID NOS : 5 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 3 

LENGTH: 1863 

TYPE: DNA 
; ORGANISM: homo sapiens 
US-10-054-680-3 

Query Match 100.0%; Score 1863; DB 13; Length 1863; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1863; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

1. 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TTTGTGCTCTTCGTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGC AGAACAAT GAGT CCT GTT C AGGGTC AT C GGACT GCAAGGAGGGT GT CATC CTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AC AGGGC AGAACAAT GAGT CCT GTT CAGGGTC AT C GGACT GCAAGGAGGGT GTCAT CCT G 180 

Qy 181 CCAAT CT GGT ACC C GGAGAAC CCTT C CCTT GGGGACAAGATTGC CAGGGT CATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAAT CT GGT ACC C GGAGAAC CCTT C C CTT GGGGACAAGATTGC CAGGGT CATT GT CT AT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I.I I I 

Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 TCT ATTGAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAAT T AAGAAACCCAATGGAGAA 360 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II MINIM 

Db 301 TCT AT T GAAGT CAT C ACCT CT CAAGAGAGGGAGGT GACAAT TAAGAAACCCAAT GGAGAA 360 

Qy 361 AC CAGC ACAAC CACT ATT C GGGT CT GGAAT GAAACT GT CT C CAACCT GAC CCTT AT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ACC AGCACAAC CACT ATT C GGGT CT GGAAT GAAACT GT CT CCAACCT GACC CTT ATGGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 



Qy 



4 81 AT T GCT GGTGAT CT GGGAC CT T CT AC CAT T GT AGGGAGT GCAGC CT T CAAC ATGT T CAT C 540 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 

Db 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

Qy 541 AT CATT GGCAT CT GT GTCT AC GT GAT C C CAGAC GGAGAGACT CGCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I II I 1 I I I I I I I I I I I I I I I I I I I I I 
Db 541 AT CATTGGCATCTGTGTCTACGT GATCCCAGACGGAGAGACT CGCAAGAT CAAGCAT CT A 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CGAGT CTT CTTCATCACCGCT GCT T GGAGT AT CTTT GCCT ACAT CTGGCT CTATAT GATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACA7^ATAC 780 

Qy 781 ATGCACAAAAAGT ACC GC ACAGACAAACACC GAGGAAT TAT CAT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AT GCACAAAAAGT ACC GC ACAGACAAACACC GAGGAAT TAT CAT AGAGACAGAGGGT GAC 840 

Qy 841 CACCCT AAGGGCATT GAGAT GGAT GGGAAAAT GAT GAAT T CCC AT TTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CACCCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAAT T CCCATTTT CT AGAT GGGAAC 900 

Qy 901 CT GGT GC C CCTGGAAGGGAAGGAAGT GGAT GAGT C CCGCAGAGAGAT GAT C CGGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 CT GGT GCC CCTGGAAGGGAAGGAAGT GGAT GAGT C C CGCAGAGAGAT GAT C CGGATT CT C 960 

Qy 961 AAGGAT CT GAAGCAAAAAC ACC CAGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGGAT CT GAAGCAAAAACAC CCAGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGCCAAT 1020 

Qy 1021 TACT AT GCT CTT T CC CAC CAACAGAAGAGCCGCGC CTT CT ACCGT AT C CAAGCCACT CGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TACT AT GCT CTTT CC CACCAACAGAAGAGC CGCGC CTT CT ACCGT ATCCAAGC CACT CGT 1080 

Qy 1081 ATGAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGC C 1140 

Qy 1141 T CCAGCATGAGCGAGGTGCACAC C GAT GAGCCT GAGGACT T T ATTTC CAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 T CCAGCAT GAGC GAGGTGCACAC C GAT GAGCCT GAGGACTTT ATTTCCAAGGT CTT CTTT, .1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 GAC C CAT GT T CTT ACCAGT GCCTGGAGAACT GT GGGGCT GT ACT C CT GAC AGT GGT GAGG 1260 

Qy 1261 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGTTCT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1261 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGT TCT GC C 1320 

Qy 1321 AAT GC AGGGGCT GACT AT GAGTT C AC AGAGGGCAC GGT GGT T CT GAAGCCAGGAGAGAC C 1380 

I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



1321 AAT GCAGGGGCT GACT AT GAGT T CACAGAGGGCACGGTGGTT CT GAAGCCAGGAGAGACC 



1380 



Qy 1381 CAGAAGGAGTT CT C C GT GGGCATAATT GAT GAC GACATTTTT GAGGAGGAT GAAC ACTT C 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGAAGGAGTT CT C C GT GGGCATAATT GAT GAC GACATTTTT GAGGAGGAT GAACACT T C 

Qy 1441 TTT GTAAGGT T GAGCAAT GT CC GCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GC CT CC A 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 TTT GTAAGGTT GAGCAAT GT C C GCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GC CT CCA 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 

Qy 1561 GTTACCATCTTGGATGAT GACCATGCAGGCATCTTCACTTTT GAATGTGATACTATTCAT 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1561 GTTACCATCTTGGATGAT GACCAT GCAGGCATCTTCACTTTTGAATGTGATACTATT CAT 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 

I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1621 GT C AGT GAGAGT ATT GGT GTT AT GGAGGT CAAGGTT CTGCGGACAT CAGGT GCC CGGGGT 

Qy 1681 AC AGT CAT CGT C CC CTT T AGGAC AGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACT TT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 ACAGT CAT CGT C C C CTT T AGGAC AGT AGAAGGGACAGCCAAGGGT GGC GGT GAGGACTTT 

Qy 1741 GAAGACACAT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACT GT AT GT GACAGACAGGAA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1741 GAAGACACAT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACT GT ATGT GACAGACAGGAA 

Qy 1801 GCT GACTAT GGAAGAAGAGGAGGCCAAGAGGAT AGCAGAGAT GGGAAAGCC AGT ATT GGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 GCT GACTAT GGAAGAAGAGGAGGCCAAGAGGAT AGCAGAGAT GGGAAAGCCAGT ATT GGG 

Qy 1861 TGA 1863 

I I I 

Db 1861 TGA 1863 
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Query Match 95.8%; Score 1784.6; DB 13; Length 2766; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 61 TT T GT GCT CTT CCT GAAT GGT CT T C GAGCAGAGGCT GGT GGCT CAGGGGACGT GC CAAGC 120 

Qy 121 AC AGGGCAGAACAAT GAGT CCT GT T CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 121 ACAGGGCAGAACAATGAGT CCTGTTCAGGGTCAT CGGACTGCAAGGAGGGTGTCATCCTG 180 

Qy 181 CCAAT CT GGT ACC CGGAGAACC CTT C C CTT GGGGACAAGATT GCCAGGGT C ATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAAT CT GGT AC CCGGAGAAC C CT T C C CTT GGGGACAAGATT GC CAGGGT CAT T GT CT AT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGG GAGGT GACAATTAAGAAAC C CAAT GGAGAA 360 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 301 TCT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC CCAATGGAGAA 360 

Qy 361 AC C AGCACAACCACT ATT C GGGT CT GGAAT GAAACT GTCT CCAAC CT GACC CT TATGGCC 420 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AC CAGCACAAC CACTATT CGGGT CT GGAAT GAAACT GT CT CCAACCT GAC C CT T AT GGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I II I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 ATT GCT GGT GAT CT GGGAC CTT CT AC CATT GT AGGGAGT GCAGCCTTCAACAT GTT CAT C 540 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

Qy 541 AT CATT GGCAT CTGTGTCTACGTGATCCCAGACGGAGAGACTCGCAAGAT CAAGCATCTA 600 

I I I I I II II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 AT CAT T GGCAT CT GT GT CT AC GT GAT CCCAGAC GGAGAGACT CGCAAGAT CAAGCAT CT A 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CGAGT CTT CTT CAT CACCGCT GCTT GGAGT ATCTTT GCCT ACAT CT GGCT CT AT AT GATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 



Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I 1 I I I 
Db 721 TT T CCAGT GT GT GT CCTT CTGGCCT GGGT GGCAGATAAACGACT GCTCTT CT ACAAATAC 780 

Qy 781 AT GCACAAAAAGT AC CGC ACAGACAAACACCGAGGAATT AT CATAGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 1 I I I I 

Db 781 AT GCACAAAAAGT AC C GCACAGACAAACAC CGAGGAATT AT CAT AGAGAC AGAGGGT GAC 840 

Qy 841 C AC C CTAAGGGC AT T GAGATGGAT GGGAAAAT GAT GAATT C CCATT TT CT AGAT GGGAAC 900 

II I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 CACCCTAAGGGCATT GAGATGGAT GGGAAAAT GAT GAATT CCCATTTTCT AGAT GGGAAC 900 

Qy 901 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT C CCGCAGAGAGAT GAT C CGGATTCT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CT GGT GCCC CTGGAAGGGAAGGAAGT GGAT GAGT C CC GCAGAGAGAT GAT CCGGATT CT C 960 

Qy 961 AAGGAT CT GAAGCAAAAACACCC AGAGAAGGACT T AGAT C AGCT GGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGT GGAGATGGCCAAT 1020 

Qy 1021 TACT AT GCT CTT T CC CACCAACAGAAGAGC C GC GC CT T CT ACC GT AT CCAAGC CACT CGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TACT AT GCT CT TT CC CAC CAACAGAAGAGCCGCGC CTT CT ACCGT AT C CAAGC CACT CGT 1080 

Qy 1081 AT GAT GACT GGT GCAGGCAAT ATC CT GAAGAAACAT GCAGC AGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGC C 1140 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 T C C AGCAT GAGC GAGGT GC AC ACC GAT GAGC CT GAGGACTTT ATT T CCAAGGT CTT CT T T 1200 

Qy 1201 GACC CAT GTT CTT AC CAGT GCCT GGAGAACT GT GGGGCT GT ACT CCT GAC AGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1201 GAC C CAT GT T CT T AC CAGT GC CT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGT GAGG 1260 

Qy 1261 AAAGGGGGAGACATGT CAAAGACCATGTAT GTGGACTACAAAACAGAGGATGGTTCT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 AAAGGGGGAGACAT GT CAAAGACCATGTAT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 1320 

Qy 1321 AATGCAGGGGCTGACTAT GAGTT CACAGAGGGCAC GGT GGTT CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 AAT GCAGGGGCT GACT AT GAGT T CACAGAGGGCAC GGT GGTT CT GAAGCCAGGAGAGACC 1380 

Qy 1381 CAGAAGGAGTTCT CCGT GGGCATAATTGAT GACGACATTTTTGAGGAGGAT GAACACTTC 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I 
Db 1381 CAGAAGGAGTTCTCCGTGGGCATAATT GAT GACGACATTTTTGAGGAGGATGAACACTT C 1440 

Qy 1441 TTTGTAAGGTTGAGCAAT GTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1441 TTT GTAAGGTTGAGCAATGT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GTT ACC ATCTT GGAT GAT GAC CAT GCAGGCAT CTT CACT TTT GAAT GT GAT ACT AT T CAT 1620 



Db 1561 GTT ACC AT CTT GGAT GATGAC CAT GC AGGCAT CTT C ACT TTT GAAT GT GAT ACT ATT CAT 1620 

Qy 1621 GT CAGT GAGAGT AT T GGTGTT ATGGAGGT CAAGGTT CTGC GGAC AT CAGGT GCC C GGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 GT CAGT GAGAGT AT T GGTGT T ATGGAGGT CAAGGTT CTGC GGAC AT CAGGT GCC C GGGGT 1680 

Qy 1681 AC AGT CAT C GT C CCCTT T AGGACAGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

Qy 1741 GAAGACACAT AT GGGGAGTT GGAATT CAAGAATGAT GAAACT GT AT GT GAC AGACAGGAA 1800 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I 

Db 1741 GAAGACACAT AT GGGGAGTT GGAATT CAAGAATGAT GAAAC T GT GAAAACCATAAG 1796 

Qy 1801 GCTGACT AT GGAAGAAGAGGAGGC CAAGAGGATAGC AGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

Db 1797 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 1837 
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US-10-054-680-5 

Query Match 95.8%; Score 1784.6; DB 13; Length 3812; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels ... .4; Gaps 1; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 618 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 677 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 678 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 737 



Qy 



121 ACAGGGC AGAACAAT GAGT C CT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GTCAT C CT G 180 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 



Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



738 AC AGGGCAGAACAATGAGT CCTGTT C AGGGT CAT C GGACT G CAAGGAGGGT GT CAT C CT G 797 



181 



798 



241 



858 



301 



918 



361 



978 



421 



CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I II t I i I I I I I I I I I I I I 

CCAAT CT GGT AC CCGGAGAACC CTT C C CTT GGGGACAAGAT T GCC AGGGT CATT GT CTAT 

TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 
I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 

T CTAT TGAAGT CAT CACCT CTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCTATTGAAGTCATCACCT CTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 



240 



857 



300 



917 



360 



977 



420 



ACCAGCACAACC ACT ATT C GGGT CT GGAAT GAAACT GT CTC CAACCT GACCCT TAT GGC C 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I 
ACCAGCACAACC ACT ATT C GGGTCT GGAAT GAAACT GT CTC CAAC CT GAC CCTT AT GGCC 1037 



480 



CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1038 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1097 

481 ATT GCT GGT GAT CT GGGAC CT T CT AC CATT GT AGGGAGT GCAGC CTT CAACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1098 ATT GCT GGT GAT CT GGGACCTT CT AC CATT GT AGGGAGT GCAGC CTT CAACAT GTT CAT C 1157 

541 AT C ATT GGCATCT GT GTCT ACGT GAT CCCAGACGGAGAGACT CGCAAGAT CAAGCAT CT A 600 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1158 AT CAT T GGCATCT GT GT CT ACGT GAT CC CAGACGGAGAGACT CGCAAGAT CAAGCAT CT A 1217 



601 



660 



CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1218 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1277 



661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1278 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 



721 



1338 



781 



TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTT C CAGT GT GT GTC CTT CTGGCCTGGGTGGCAGATAAAC GACT GCT CTT CTACAAATAC 



720 



1337 



780 



1397 



840 



ATGCACAAAAAGT AC CGC ACAGACAAAC ACCGAGGAAT TAT CAT AGAGACAGAGGGT GAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1398 AT GCACAAAAAGT ACCGC ACAGACAAACACCGAGGAAT TAT CAT AGAGACAGAGGGT GAC 1457 



841 



1458 



901 



C ACCCTAAG GGCATT GAGAT GGAT GGGAAAAT GAT GAAT TC C CATTTT CT AGAT GGGAAC 
I I I I I I I I I I I I I I I I II I I I II I I I I I I II I I I I I II I I I I I I I I I II I I I I I I I I I I I 
CACC CTAAGGGC ATT GAGAT GGAT GGGAAAAT GAT GAATTCCCATTT T CT AGAT GGGAAC 



CTGGTGCCCCTGGAAGGGAAGGAAGT GGATGAGT CCCGCAGAGAGATGATCCGGATT CTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1518 CTGGT GC CC CTGGAAGGGAAGGAAGT GGAT GAGT C C CGC AGAGAGAT GAT C CGGATT CT C 

961 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGT GGAGATGGCCAAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1578 AAGGAT CT GAAG CAAAAAC AC C CAGAGAAGGACTT AGAT C AGCT GGT GGAGAT GGC CAAT 



900 



1517 



960 



1577 



1020 



1637 



Qy 1021 T ACT AT GCT CTTT CC CACCAACAGAAGAGCCGCGC CT T CT ACCGTAT C CAAGCCACT CGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 1638 TACT AT GCT CTTT CC CACCAACAGAAGAGC CGCGC CTT CT ACC GT AT C CAAGCCACT CGT 1697 

Qy 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GC AGC AGAACAAGC CAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I 
Db 1698 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGC AGAACAAGC CAAGAAGGCC 1757 

Qy 1141 T C CAGCAT GAGCGAGGT GC ACACCGAT GAGC CT GAGGACTTT AT TT C CAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1758 T C CAGCAT GAGC GAGGT GCACAC CGAT GAGC CT GAGGACTTT ATTT CCAAGGT CTT CTTT 1817 

Qy 1201 GACCCAT GTT CT T AC C AGT GC CTGGAGAACT GT GGGGCT GT ACT CCT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1818 GACC CAT GTT CT T AC CAGT GC CT GGAGAACT GT GGGGCT GTACT CCT GACAGT GGT GAGG 1877 

Qy 1261 AAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT GGACTACAAAACAGAGGAT GGTTCT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1878 AAAGGGGGAGACATGT CAAAGAC CAT GT AT GT GGACTACAAAACAGAGGAT GGTTCT GCC 1937 

Qy 1321 AATGCAGGGGCT GACTATGAGTTCACAGAGGGCACGGTGGTTCT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1938 AATGCAGGGGCT GACTATGAGTTCACAGAGGGCACGGT GGTT CTGAAGCCAGGAGAGACC 1997 

Qy 1381 CAGAAGGAGTTCT CCGT GGGC ATAATT GAT GACGACAT TTTT GAGGAGGAT GAAC ACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1998 CAGAAGGAGT TCT CCGT GGGCATAAT T GAT GACGACAT TTTT GAGGAGGAT GAACACTT C 2057 

Qy 1441 TTT GTAAGGTT GAGCAAT GT C CGCAT AGAGGAGGAGCAGCC AGAGGAGGGGAT GCCT C CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2058 TTT GT AAGGTTGAGCAAT GT C CGCAT AGAGGAGGAGCAGCC AGAGGAGGGGAT GCCT C C A 2117 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2118 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2177 

Qy 1561 GTT ACCATCTT GGAT GAT GAC CAT GCAGGCAT CTT C ACTTTT GAATGT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2178 GT T ACC ATCTTGGAT GAT GAC CAT GCAGGCAT CT T CACTTT T GAAT GT GAT ACT ATT CAT 2237 

Qy 1621 GTC AGT GAGAGT ATT GGT GTT AT GGAGGT CAAGGTT CT GC GGACAT CAGGT GCC CGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2238 GT CAGT GAGAGT ATTGGTGTTATGGAGGT CAAGGTTCT GCGGACAT CAGGT GCC CGGGGT 2297 

Qy 1681 AC AGTC ATCGTC C CCT TT AGGAC AGT AGAAGGGACAGC CAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I 
Db 2298 ACAGT CAT C GT C CCCTTT AGGACAGT AGAAGGGAC AGCCAAGGGT GGC GGT GAGGACTT T 2357 

Qy 1741 GAAGACACAT AT GGGGAGTTGGAATT CAAGAAT GAT GAAACT GT AT GT GAC AGACAGGAA 1800 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 2358 GAAGACACAT AT GGGGAGTT GGAAT T CAAGAAT GAT GAAAC TGTGAAAACCATAAG 2413 

Qy 1801 GCTGACTATGGAAGAAGAGGAGGCCAAGAGGATAGCAGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 

Db 2414 GGTTAAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGA 2454 



RESULT 4 
US-10-256-537-1 

Sequence 1, Application US/10256537 
Publication No. US20030162196A1 
GENERAL INFORMATION: 
APPLICANT: Carroll, Joseph M. 

TITLE OF INVENTION: METHODS OF USING 69039, A NOVEL HUMAN 
TITLE OF INVENTION: NA/CA EXCHANGER FAMILY MEMBER 
FILE REFERENCE: MPI01-231P1RM 
CURRENT APPLICATION NUMBER: US/10/256,537 
CURRENT FILING DATE: 2002-04-19 
PRIOR APPLICATION NUMBER: 60/325,737 
PRIOR FILING DATE: 2001-09-28 
NUMBER OF SEQ ID NOS : 5 

SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 1 
LENGTH: 2534 
TYPE: DNA 

ORGANISM: Homo sapien 
US-10-256-537-1 

Query Match 95.8%; Score 1784.4; DB 15; Length 2534; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 343 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 402 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db" 403 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 462 

Qy 121 ACAGGGCAGAACAAT GAGT C CT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 463 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 522 

Qy 181 CCAAT CT GGT AC CC GGAGAAC C CTT CC CT T GGGGACAAGAT T GC CAGGGT CATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 523 CCAAT CT GGT AC CC GGAGAAC C CTT CC CTT GGGGACAAGATTGC CAGGGT CATT GT CT AT 582 

Qy 241 TT TGT GGCCCT GAT ATACAT GT TC CTT GGGGT GT C CAT CATTGCT GAC CGCTT CAT GGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 583 TTTGT GGCCCT GAT AT ACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 642 

Qy 301 T CT AT T GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I II I I I I I I I I I 
Db 643 T CT AT T GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAACCCAAT GGAGAA 702 

Qy 361 AC CAGCACAACC ACT AT T CGGGT CT GGAAT GAAACTGT CTCCAACCT GAC C CTT AT GGCC 420 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 703 AC CAGCACAAC CACT ATT CGGGT CT GGAAT GAAACT GT CT CCAACCT GACC CTT AT GGC C 762 



Qy 

Db 



421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
763 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 822 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC .540 

II I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
823 AT T GCTGGTGATCT GGGACCT T CT ACCATT GT AGGGAGT GCAGC CTT CAACATGTTCAT C 882 



541 



883 



601 



AT C ATTGGCAT CT GT GT CT ACGTGAT CCCAGACGGAGAGACTC GCAAGAT CAAGCAT CT A 
I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT CATTGGCAT CTGT GTCTACGTGATCCCAGACGGAGAGACTCGCAAGAT CAAGCAT CTA 



C GAGT CT T CT T CAT CACCGCT GCT T GGAGT AT CTTT GCCT ACAT CT GGCT CT AT ATGATT 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

943 CGAGT CT T CT T CAT CACCGCT GCTT GGAGT AT CTTT GCCT ACAT CT GGCT CT AT ATGATT 



600 



942 



660 



1002 



661 



720 



CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 
I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1003 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1062 

721 TT T C CAGT GT GT GT C CTT CT GGCCT GGGTGGCAGATAAACGACT GCT CTT CTACAAATAC 780 

I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1063 T T T C CAGT GT GT GT C CTT CTGGCCT GGGT GGCAGATAAAC GACT GCT CTT CTACAAATAC 1122 

781 AT GC ACAAAAAGT AC CGCACAGACAAAC AC CGAGGAATT AT CAT AGAGACAGAGGGT GAC 840 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1123 AT GC ACAAAAAGT AC CGCACAGACAAACACCGAGGAATT AT CAT AGAGACAGAGGGT GAC 1182 



841 CACCCTAAGGGCATT GAGATGGATGGGAAAAT GATGAATT CCCATTTTCTAGATGGGAAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1183 CACCCTAAGGGCATT GAGATGGAT GGGAAAAT GAT GAATT CCCATT TT CT AGATGGGAAC 



900 



1242 



960 



901 CT GGT GCCCCT GGAAGGGAAGGAAGT GGAT GAGTCCC GCAGAGAGAT GAT CC GGATT CT C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1243 CT GGT GC CCCT GGAAGGGAAGGAAGT GGAT GAGTCCC GCAGAGAGAT GAT C CGGATT CT C 1302 

961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCT GGTGGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1303 AAGGATCT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCT GGTGGAGATGGCCAAT 1362 

1021 T ACT ATGCTCT TT C C CACCAACAGAAGAGC CGCGCCTT CT ACC GTAT C CAAGCC ACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
1363 TACT AT GCTCTTT C C CACCAAC AGAAGAGCCGCGCCTT CT ACC GTAT C CAAGCCACT C GT 1422 

1081 AT GAT GACTGGTGCAGGCAAT AT C CT GAAGAAACAT GC AGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1423 AT GAT GACTGGTGCAGGCAAT AT C CT GAAGAAACAT GCAGC AGAACAAGC CAAGAAGGC C 1482 

1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1483 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 



1542 



1201 



GAC C CAT GTT CTT AC CAGT GC CTGGAGAACTGT GGGGCT GT ACT CCT GACAGTGGTGAGG 1260 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I 
1543 GACCCAT GTTCTTACCAGT GCCTGGAGAACTGTGGGGCTGTACTCCT GACAGTGGTGAGG 



1261 AAAGGGGGAGACAT GTCAAAGACCAT GTATGT GGACTACAAAACAGAGGAT GGTTCTGCC 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1603 AAAGGGGGAGACAT GT CAAAGACCAT GTAT GT GGACTACAAAACAGAGGAT GGTT CT GCC 



1602 



1320 



1662 



Qy 1321 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGT GGTT CTGAAGCCAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 
Db 1663 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGT GGTT CT GAAGCCAGGAGAGAC C 1722 

Qy 1381 CAGAAGGAGTTCT CCGTGGGCATAATT GATGACGACATTTTTGAGGAGGATGAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I 
Db 1723 CAGAAGGAGTTCT CCGTGGGCATAATT GATGACGACATTTTTGAGGAGGATGAACACTTC 1782 

Qy 1441 TTT GTAAGGTT GAGCAAT GTCC GCAT AGAGGAGGAGCAGC C AGAGGAGGGGAT GCCTCCA 1500 

I II I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1783 TTT GTAAGGTT GAGCAAT GTCC GCAT AGAGGAGGAGCAGC CAGAGGAGGGGAT GCCTCCA 1842 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1843 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1902 

Qy 1561 GTT AC CAT CTT GGATGAT GACCAT GCAGGC AT CTT C ACTTTT GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1903 GTTACCAT CTT GGATGAT GACCATGCAGGCATCTT CACTTTTGAATGTGATACTATTCAT 1962 

Qy 1621 GT CAGT GAGAGT ATTGGT GTT AT GGAGGT CAAGGT T CT GCGGACAT CAGGT GC C C GGGGT 1680 

I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II 
Db 1963 GTCAGT GAGAGT ATTGGT GTT AT GGAGGT CAAGGT T CT GCGGACAT CAGGT GC CC GGGGT 2022 

Qy 1681 ACAGT CAT C GT C C C CTTT AGGACAGT AGAAGGGACAGC CAAGGGT GGC GGT GAGGACT TT 174 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2023 ACAGT CAT C GT CC C CTT T AGGACAGT AGAAGGGACAGC CAAGGGT GGCGGT GAGGACTTT 2082 

Qy 1741 GAAGACAC AT AT GGGGAGTTGGAATT CAAGAAT GAT GAAACT GTAT 1786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2083 GAAGACACATAT GGGGAGTTGGAATT CAAGAAT GAT GAAACT GTGT 2128 



RESULT 5 
US-10-256-537-3 

; Sequence 3, Application US/10256537 
; Publication No. US20030162196A1 
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LOCATION: (343) ... (2130) 
US-10-256-537-3 



Query Match 95.8%; Score 1784.4; DB 15; Length 2534; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
343 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 402 

61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
403 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 462 

121 AC AGGGCAGAACAAT GAGT CCT GTT C AGGGT CAT CGGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
463 AC AGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT C CT G 522 

181 CCAAT CTGGT ACC C GGAGAAC CCTT C CCTT GGGGACAAGAT T GC CAGGGT CAT T GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
523 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 582 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
583 TT T GT GGC CCT GAT AT ACAT GTT C CTT GGGGT GT CCAT C ATT GCT GAC C GCTT CAT GGCA 642 

301 TCT AT T GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAAT TAAGAAACC CAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
643 TCTATTGAAGT CAT CACCT CTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 702 

361 AC CAGC ACAACC ACT ATT C GGGT CT GGAAT GAAACT GT CT CCAACCT GACC CTT AT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
703 AC CAGCACAAC C ACT ATT C GGGT CT G GAAT GAAACT GT CT CCAAC CT GAC C CTT AT GGC C 762 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
763 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 822 

481 ATT GCT GGT GAT CT GGGAC CTT CT AC C ATT GT AGGGAGT GCAGCCTT CAACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
823 ATT GCT GGT GAT CT GGGAC CTT CT ACC ATT GTAGGGAGT GCAGCCTT CAACAT GTT CAT C 882 

541 ATCATTGGCATCTGTGTCTACGTGAT CCCAGACGGAGAGACT CGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
883 AT CATT GGCAT CT GT GT CTACGT GAT C CCAGACGGAGAGACT CGCAAGATCAAGCATCTA 942 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

943 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1002 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 
I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1003 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1062 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1063 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1122 



Qy 



781 



AT GCACAAAAAGT ACC GC ACAGACAAACAC C GAGGAATT ATC AT AGAGACAGAGGGT GAC 840 



Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 



1123 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I 
AT GCACAAAAAGT AC CGCACAGACAAACAC CGAGGAATT AT CAT AGAGACAGAGGGT GAC 



841 



1182 



900 



CAC CCTAAGGGCATT GAGATGGAT GGGAAAAT GATGAATT CCCATTTT CT AGAT GGGAAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 1 I I I I I I I I I I I I I I I 
1183 CAC CCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATTC CC ATTTT CT AGAT GGGAAC 1242 

901 CT GGT GCCCCT GGAAGGGAAGGAAGT GGAT GAGT C CCGCAGAGAGAT GAT CCGGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1243 CT GGT GC CC CTGGAAGGGAAGGAAGTGGAT GAGT CCC GCAGAGAGAT GAT C CGGATT CT C 1302 

961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGCCAAT 1020 
I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1303 AAGGAT CT GAAGCAAAAACAC C CAGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGCCAAT 1362 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I 
1363 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1422 

1081 AT GAT GACT GGT GCAGGCAAT ATCCT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1423 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GC AGCAGAACAAGCCAAGAAGGCC 1482 

1141 T CC AGCAT GAGC GAGGTGC AC AC C GAT GAGC CT GAGGACTTT AT TTCCAAGGT CTT CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1483 TCCAGCAT GAGCGAGGTGCACACCGAT GAGC CT GAGGACTTT ATTTCCAAGGT CTT CTTT 1542 

1201 GAC C CAT GTT CT T AC CAGT GC CT GGAGAACT GT GGGGCT GT ACT C CT GAC AGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1543 GAC CCAT GT T CTT AC CAGT GCCT GGAGAACT GT GGGGCT GTACT CCT GACAGT GGT GAGG 1602 

1261 AAAGGGGGAGACAT GT CAAAGACCAT GT AT GT GGACT ACAAAAC AGAGGAT GGTTCT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1603 AAAGGGGGAGACATGT CAAAGACCAT GT AT GT GGACT ACAAAACAGAGGAT GGTTCTGCC 1662 

1321 AATGCAGGGGCTGACTAT GAGTTCACAGAGGGCACGGT GGTTCT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1663 AAT GC AGGGGCT GACT AT GAGT T CACAGAGGGCAC GGT GGT T CT GAAGCCAGGAGAGACC 1722 

1381 CAGAAGGAGTT CT CCGTGGGC AT AAT T GAT GAC GAC ATTT T T GAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1723 CAGAAGGAGT TCT CCGT GGGCATAATT GAT GACGACAT T TTT GAGGAGGAT GAACACT T C 1782 

1441 TTT GTAAGGTTGAGCAATGTCCGCAT AGAGGAGGAGCAGCCAGAGGAGGGGATGCCT CCA 1500 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1783 TTTGTAAGGTTGAGCAAT GT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GCCTCCA 1842 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1843 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1902 

1561 GTTACCATCTTGGATGAT GAC CAT GCAGGCATCTT CACTTTTGAATGT GATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I' I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1903 GTTACCATCTTGGATGATGACCATGCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 1962 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



1963 



GTCAGT GAGAGT ATTGGT GTT ATGGAGGT CAAGGT TCT GCGGACAT C AGGT GCCC GGGGT 2022 



Qy 1681 ACAGT CAT C GT CCC CTTT AGGACAGTAGAAGGGACAGC CAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2023 ACAGT C AT CGT CC C CTTT AGGACAGTAGAAGGGACAGC CAAGGGT GGC GGT GAGGACTTT 2082 

Qy 1741 GAAGAC ACAT AT GGGGAGTTGGAATT CAAGAAT GATGAAACT GTAT 1786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2083 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GTGT 2128 



RESULT 6 
US-10-275-116-1 

; Sequence 1, Application US/10275116 
; Publication No. US20030096312A1 
; GENERAL INFORMATION: 
; APPLICANT: Merck Patent GmbH 

; TITLE OF INVENTION: No. US20030096312Alel natrium- calium exchanger protein 
; FILE REFERENCE: HNCX3CWWS 

; CURRENT APPLICATION NUMBER: US/10/275,116 

; CURRENT FILING DATE: 2002-11-01 

; NUMBER OF SEQ ID NOS : 2 

; SOFTWARE: Patentln Ver. 2.1 

; SEQ ID NO 1 

LENGTH: 2781 

TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE : 

NAME/KEY: CDS 

LOCATION: (1) . . (2781) 
US-10-275-116-1 

Query Match 95.7%; Score 1783; DB 14; Length 2781; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGCAGAACAATGAGTCCTGTT CAGGGTCATCGGACT GCAAGGAGGGTGTCAT CCTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I U U I I I I I I I 
Db 121 ACAGGG CAGAACAAT GAGT CCT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 180 

Qy 181 CCAAT CT GGTAC C C GGAGAAC C CTT C C CTT GGGGACAAGATT GCC AGGGT CATTGT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 TCTATT GAAGT CAT CACCTCT CAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 360 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 TCT ATTGAAGT CAT CAC CT CT CAAGAGAGGGAGGTGACAATTAAGAAACC CAAT GGAGAA 360 

361 AC C AGCACAAC CACT ATT CGGGT CT GGAAT GAAACT GTCT CCAAC CTGAC C CTT AT GGCC 420 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

361 AC C AGCACAAC CACT ATT C GGGT CT GGAAT GAAACT GTCT CCAAC CTGAC C CTTATGGC C 420 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

481 ATT GCT GGT GAT CT GGGACCT T CT ACCATT GTAGGGAGT GC AGCCTT CAACAT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

481 ATT GCT GGT GAT CT GGGACCTT CT ACCATT GTAGGGAGT GC AGCCTT CAACAT GT T CAT C 540 

541 AT C ATT GGC AT CT GT GT CT AC GT GAT CCCAGAC GGAGAGACT C GCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

541 AT C ATT GGC AT CT GT GT CT AC GT GATCC CAGACGGAGAGACT C GCAAGAT CAAGCAT CT A 600 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

I I I I I I I I II I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

841 CAC CCTAAGGGCAT T GAGAT GGAT GGGAAAAT GATGAAT T CCCATT T T CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 CACCCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAAT T CCCATTTT CT AGAT GGGAAC 900 

901 CT GGT GCCC CT GGAAGGGAAGGAAGT GGAT GAGT CC C GCAGAGAGATGAT CC GGATT CT C 960 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CT GGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGT C C CGC AGAGAGATGAT CCGGATT CT C 960 

961 AAGGATCT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGTGGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 AAGGAT CT GAAGCAAAAACAC C CAGAGAAGGACT T AGAT CAGCTGGTGGAGAT GGC CAAT- . 1020 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1080 

1081 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAACAT GCAGC AGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 1140 



Qy 1141 TC C AGCAT GAGCGAGGT GC AC AC C GAT GAGC CT GAGGACTTT ATTT CCAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I II I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



1141 T C CAGCATGAGCGAGGT GC ACACCGAT GAGCCTGAGGACT TT ATTT CCAAGGT CT T CTTT 1200 

1201 GACCCAT GTT CTT AC C AGT GCCTGGAGAACT GTGGGGCT GTACT CCT GACAGTGGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I i I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 GACCCAT GTT CTT AC C AGT GCCTGGAGAACT GTGGGGCT GTACT CCT GACAGT GGT GAGG 1260 

1261 AAAGGGGGAGAC AT GT CAAAGACCAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 1320 

- I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 AAAGGGGGAGAC AT GT CAAAGACCAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 1320 

1321 AATGCAGGGGCT GACT ATGAGT TCAC AGAGGGCAC GGTGGTT CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 AATGCAGGGGCT GACT ATGAGTTCAC AGAGGGCAC GGTGGTT CT GAAGC CAGGAGAGAC C 1380 

1381 CAGAAGGAGTT CTCCGT GGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 CAGAAGGAGTT CTCCGT GGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 1440 

1441 TTTGTAAGGTT GAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

1561 GT TACCAT CT T GGAT GATGACCAT GC AGGCAT CTT CACTT T T GAAT GT GAT ACTATT CAT 1620 

I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 GT TACCAT CT T GGAT GATGACCAT GC AGGCAT CTT CACTT T T GAAT GT GAT ACTATT CAT 1620 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 GT C AGT GAGAGT AT T GGT GTT ATGGAGGT CAAGGTT CT GCGGACAT C AGGT GC C C GGGGT 1680 

1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1681 AC AGT C ATC GT C CC CTTTAGGACAGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 1740 

1741 GAAGACACATAT GGGGAGTTGGAATTCAAGAATGAT GAAACTGTATGTGACAGACAGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I 

1741 GAAGACACATAT GGGGAGTT GGAATT CAAGAATGATGAAAC T GT GAAAAC C AT AAG 1796 

1801 GCT GACT AT GGAAGAAGAGGAGGCCAAGAGGAT AG C AGAGA 1841 

III I I I I I I I I I I I I I I I I I I I I 
1797 GGTTAAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGA 1837 



RESULT 7 

US-09-804-474A-1 

; Sequence 1, Application US/09804474A 

; Patent No. US20020119518A1 

; GENERAL INFORMATION: 

; APPLICANT: KODET, Stefan et al 

; TITLE OF INVENTION: ISOLATED HUMAN TRANSPORTER PROTEINS, 

; TITLE OF INVENTION: NUCLEIC ACID MOLECULES ENCODING HUMAN TRANSPORTER 
PROTEINS, 

; TITLE OF INVENTION: AND USES THEREOF 



; FILE REFERENCE: CL000891 

; CURRENT APPLICATION NUMBER: US/09/804 , 474A 
; CURRENT FILING DATE: 2001-03-13 
; NUMBER OF SEQ ID NOS : 4 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 1 

LENGTH: 2782 

TYPE: DNA 

ORGANISM: Human 
US-09-804-474A-1 

Query Match 95.7%; Score 1783; DB 9; Length 2782; 

Best Local Similarity 98.4%; Pred. No. 0; 

Matches 1812; Conservative 0; Mismatches 25; Indels 4; Gaps 1; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 10 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 69 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 70 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 129 

Qy 121 AC AGGGCAGAACAAT GAGT CCT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 180 

I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 130 AC AGGGCAGAACAAT GAGT CCT GT T CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT C CT G 189 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 190 C CAAT CT GGT AC CCGGAGAACCCTT CC CTT GGGGACAAGATT GC CAGGGT CATT GT CTAT 249 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 250 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 309 

Qy 301 T CT ATT GAAGT C ATCACCT CT CAAGAGAGGGAGGT GACAAT TAAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 310 TCTATT GAAGTCATCACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 369 

Qy 361 ACCAGCACAACCACT ATT C GGGT CT GGAAT GAAACT GT CTC CAACCT GAC C CTT AT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 370 ACCAGCACAACCACT ATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 429 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 489 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I 

Db 490 AT T GCT GGT GAT CTGGGACCTT CT ACCATT GT AGGGAGT GCAGC CTT CAACATGTT CAT C 549 

Qy 541 ATCATT GGCATCT GTGTCTACGTGATCCCAGACGGAGAGACT CGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 550 AT CATT GGC ATCT GT GT CT ACGT GAT C C C AGAC GGAGAGACT C GCAAGAT CAAGCAT CT A 609 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



610 C GAGT CTT CTT CAT CAC C GCT GCT T GGAGT AT CTTT GCCT ACAT CT GGCT CT ATAT GATT 669 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
67 0 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 729 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 789 

781 AT GC ACAAAAAGT AC CGC AC AGACAAACAC C GAGGAATTAT CATAGAGACAGAGGGTGAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
790 AT GCACAAAAAGTACCGCACAGACAAACACCGAGGAATTAT CATAGAGACAGAGGGTGAC 849 

841 CACCCTAAGGGCATTGAGATGGAT GGGAAAATGATGAATT CCCATTTT CTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
850 CACCCTAAGGGCATTGAGATGGAT GGGAAAATGATGAATT CCCATTTT CTAGATGGGAAC 909 

901 CT GGT GC C C CT GGAAGGGAAGGAAGT GGAT GAGT CC C GCAGAGAGAT GAT CCGGATT CTC 960 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
910 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GAT CCGGAT CCT C 969 

961 AAGGATCT GAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGT GGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
970 AAGGAT CT GAAGCAAAAACACCC AGAGAAGGACTT AGATC AGCT GGT GGAGAT GGCCAAT 1029 

1021 T ACT AT GCT CTTTC C CAC CAACAGAAGAGC C GCGCCT T CT ACC GT AT C CAAGC CACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
1030 TACT AT GCT CTTTC C CAC CAACAGAAGAGCC GCGCCT T CT ACC GT AT C CAAGCCACT C GT 1089 

1081 AT GAT GACT GGT GCAGGCAATAT CCTGAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1090 AT GAT GACT GGT GCAGGCAATAT CCTGAAGAAACATGCAGCAGAACAAGC CAAGAAGGC C 1149 

1141 T C C AGCAT GAGC GAGGT GC ACACC GAT GAGCCT GAGGACTTT ATT TC CAAGGT CT T CTTT 1200 

. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1150 T C CAGCAT GAGC GAGGT GC ACACC GAT GAGCCT GAGGACT TT AT TT CCAAGGT CTT CTTT 1209 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
1210 GACC C AT GTT CTT AC CAGT GCCT GGAGAACT GT GGGGCTGT ACT CCT GACAGT GGT GAGG 



1269 



1261 



AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1270 AAAGGGGGAGACATGTCAAAGACCATGTATGTGGACTACAAAACAGAGGATGGTTCTGCC 1329 

1321 AAT GC AGGGGCT GACTAT GAGT T CACAGAGGGCAC GGT GGTT CT GAAGCCAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1330 AATGCAGGGGCT GACTAT GAGTTCACAGAGGGCACGGT GGTTCTGAAGCCAGGAGAGACC 1389 

1381 C AGAAGGAGT T CT C C GT GGGCATAATT GAT GACGACATTTT TGAGGAGGAT GAACACTT C 1440 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1390 C AGAAGGAGTT CT CCGT GGGCATAATT GAT GACGAC ATTTTT GAGGAGGAT GAACACTT C 1449 

1441 T TTGTAAGGTT GAGCAAT GT CC GCAT AGAGGAGGAGCAGCC AGAGGAGGGGAT GCCT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1450 T TT GTAAGGTT GAGCAAT GT CCGCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT CCA 1509 



Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I 1 I I I I I I II I I I I I I I I I I I I I I I I 11 I I I I I I I I 

Db 1510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1569 

Qy 1561 GTT AC CAT CTT GGATGAT GACCAT GC AGGC AT CTT CACTTTT GAAT GTGAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1570 GTT AC CAT CTT GGATGAT GACCAT GC AGGCAT CTT CACTTTT GAAT GT GAT ACT AT T CAT 1629 

Qy 1621 GT CAGT GAGAGT AT T GGT GTTATGGAGGT CAAGGTTCT GCGGACAT CAGGT GC CC GGGGT 1680 

II I I I I I I I II I I I I I I I I I II II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1630 GTCAGT GAGAGT ATT GGT GT T ATGGAGGT CAAGGTTCT GCGGACAT CAGGT GCCC GGGGT 1689 

Qy 1681 ACAGTCAT CGT C CC CT TT AGGACAGT AGAAGGGAC AGC CAAGGGT GGC GGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1690 ACAGT CAT C GT C CC CTT T AGGACAGT AGAAGGGACAGC CAAGGGT GGC GGT GAGGACTTT 1749 

Qy 1741 GAAGACAC AT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACT GTAT GT GACAGAC AGGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I 

Db 1750 GAAGACACAT AT GGGGAGTT GGAAT T CAAGAAT GAT GAAAC T GT GAAAAC C ATAAG 1805 

Qy 1801 GCT GACT AT GGAAGAAGAGGAGGCCAAGAGGAT AGCAGAGA 1841 

I I I I I I I I I I I I I I I I I I I I I I I 

Db 1806 GGTTAAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGA 1846 



RESULT 8 

US-09-804-474A-3 

; Sequence 3, Application US/09804474A 

; Patent No. US20020119518A1 

; GENERAL INFORMATION: 

; APPLICANT: KODET, Stefan et al 

; TITLE OF INVENTION: ISOLATED HUMAN TRANSPORTER PROTEINS, 

; TITLE OF INVENTION: NUCLEIC ACID MOLECULES ENCODING HUMAN TRANSPORTER 
PROTEINS, 

; TITLE OF INVENTION: AND USES THEREOF 
; FILE REFERENCE: CL000891 

; CURRENT APPLICATION NUMBER: US/09/804 , 474A 
; CURRENT FILING DATE: 2001-03-13 
; NUMBER OF SEQ ID NOS : 4 

; SOFTWARE: Fast SEQ for Windows Version 4.0 
; SEQ ID NO 3 

LENGTH: 126512 

TYPE: DNA 
; ORGANISM: Human 

FEATURE: ... 
; NAME/KEY: misc_feature 
; LOCATION: ( 1) ...( 126512 ) 

OTHER INFORMATION: n = A,T,C or G 
US-09-804-474A-3 

Query Match 95.7%; Score 1782.8; DB 9; Length 126512; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1784; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II 



Db 2010 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 2069 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2070 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 2129 

Qy 121 ACAGGGC AGAACAAT GAGT CCT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2130 ACAGGGCAGAACAAT GAGT CCT GTTCAGGGTCAT CGGACTGCAAGGAGGGT GTCATCCT G 2189 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2190 C CAAT CT GGT AC CCGGAGAAC C CT T CCCTT GGGGACAAGATT GCCAGGGT CATT GT CTAT 2249 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I II I I I I I I I I II 

Db 2250 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 2309 

Qy 301 TCT ATT GAAGTCATCACCT CTCAAGAGAGGGAGGTGACAATTAAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I II I I I II I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I II II I I 
Db 2310 T CTAT T GAAGTCAT CACCT CT CAAGAGAGGGAGGT GACAAT TAAGAAACC CAAT GGAGAA 2369 

Qy 361 ACCAGC ACAACC ACT ATT CGGGT CT GGAAT GAAACT GT CT C CAAC CT GACC CTTAT GGCC 420 

I I I I II I I I I I I I I II I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2370 ACC AGCACAACAACT ATT C GGGT CT GGAAT GAAACT GT CT CCAACCT GACC CTTAT GGCC 2429 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 2489 

Qy 481 ATT GCT GGT GAT CT GGGAC CT T CT ACCATT GT AGGGAGT GC AGC CTT CAACAT GTT CAT C 540 

I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2490 ATT GCT GGT GAT CT GGGACCT T CT AC CATT GT AGGGAGT GCAGCCTT CAACAT GTT CAT C 2549 

Qy 541 ATCATT GGCATCT GTGTCTACGTGAT CCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2550 ATCATTGGCATCT GTGTCT ACGT GATCCCAGACGGAGAGACT CGCAAGAT CAAGCATCTA 2609 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2610 CGAGT CT TCT T CAT C ACCGCT GCT T GGAGT AT CTT T GC CT ACAT CTGGCT CT AT AT GATT 2669 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 2729 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 2789 

Qy 781 ATGCACAAAAAGT ACC GC AC AGACAAACAC C GAGGAATT AT C AT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2790 AT GCACAAAAAGT AC C GC ACAGACAAACACCGAGGAAT TAT CAT AGAGACAGAGGGT GAC 2849 

Qy 841 C ACC CT AAGGGC ATT GAGAT GGAT GGGAAAAT GAT GAATTC CCATTTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2850 CACC CTAAGGGC ATT GAGAT GGAT GGGAAAAT GAT GAATT C C C ATTT T CT AGAT GGGAAC 2909 



Qy 901 CT GGT GC CCCTGGAAGGGAAGGAAGT GGAT GAGT C CC GCAGAGAGAT GAT CCGGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2910 CT GGTGCCCCT GGAAGGGAAGGAAGT GGAT GAGT CC C GCAGAGAGAT GAT CCGGATT CT C 2969 

Qy 961 AAGGAT CTGAAGCAAAAACACC CAGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGCCAAT 1020 

I I II I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 2970 AAGGAT CTGAAGCAAAAAC ACC CAGAGAAGGACT T AGAT CAGCT GGTGGAGAT GGC CAAT 3029 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3030 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 3089 

Qy 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACATGC AGCAGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3090 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GC AGCAGAACAAGC CAAGAAGGCC 3149 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3150 T CCAGCATGAGCGAGGTGCACAC C GAT GAGC CT GAGGACTT T ATTT CCAAGGT CTT CTT T 3209 

Qy 1201 GAC C CAT GTT CTT AC C AGT GCCT GGAGAACT GT GGGGCT GTACT CCT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3210 GAC C CAT GTT CTT AC C AGT GC CT GGAGAACT GT GGGGCT GTACT CCT GACAGT GGT GAGG 3269 

Qy 1261 AAAGGGGGAGACAT GT CAAAGACCAT GT AT GT GGACT ACAAAAC AGAGGAT GGTT CT GC C 1320 

I I I I I I I I I I II I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 3270 AAAGGGGGAGACATGT CAAAGACCAT GT AT GT GGACT ACAAAACAGAGGAT GGTTCT GC C 3329 

Qy 1321' AAT GCAGGGGCT GACT AT GAGTT CAC AGAGGGCACGGT GGTT CT GAAGCCAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3330 AAT GCAGGGGCT GACT AT GAGTT CAC AGAGGGCACGGT GGTT CT GAAGCCAGGAGAGAC C 3389 

Qy 1381 CAGAAGGAGTT CT CCGT GGGCAT AATT GAT GAC GACAT T TTT GAGGAGGAT GAACACT T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3390 C AGAAGGAGTTCT CC GT GGGCAT AATT GAT GAC GACAT T TT T GAGGAGGAT GAACACTT C 3449 

Qy 1441 TTT GTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT CCA 1500 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3450 TTT GTAAGGTTGAGCAAT GTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 3509 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 3569 

Qy 1561 GT TACCAT CTT GGAT GAT GAC CAT GC AGGCAT CTT CACT TTT GAATGT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 3570 GTTACCATCTTGGAT GAT GACCATGCAGGCAT CTTCACTTTTGAATGT GATACTATT CAT 3629 

Qy 1621 GTCAGT GAGAGTATT GGT GTTAT GGAGGTCAAGGTTCTGCGGACATCAGGT GCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3630 GTCAGT GAGAGTATT GGT GT TAT GGAGGT CAAGGT T CT GCGGAC AT CAGGT GC C C GGGGT 3689 

Qy 1681 AC AGT CATC GT CC CCT T T AGGACAGT AGAAGGGACAGC CAAGGGT GGC GGT GAGGACTT T 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3690 AC AGTCATC GTC C CCT T T AGGACAGT AGAAGGGACAGC CAAGGGT GGC GGT GAGGACT TT 3749 



Qy 1741 GAAGAC ACAT AT GG GGAGT T GGAATT C AAGAAT GAT GAAACT GT AT 1786 

I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3750 GAAGAC AC AT AT GGGGAGTTGGAATT CAAGAAT GAT GAAACTGT GT 3795 



RESULT 9 
US-10-114-153-1 

Sequence 1, Application US/10114153 
Publication No. US20030185815A1 
GENERAL INFORMATION: 



APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
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Shenoy, Suresh 
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Smithson, Glennda 
Guo, Xiaojia 
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NOVEL ANTIBODIES THAT BIND TO ANTIGENIC POLYPEPTIDES, 



APPLICANT 

TITLE OF INVENTION 
NUCLEIC ACIDS 

TITLE OF INVENTION: ENCODING THE ANTIGENS, AND METHODS OF USE 
FILE REFERENCE: 2 14 02- 3 22 A 

CURRENT APPLICATION NUMBER: US/10/114,153 
CURRENT FILING DATE: 2002-08-06 
PRIOR APPLICATION NUMBER: 60/281086 
PRIOR FILING DATE: 2001-04-03 
PRIOR APPLICATION NUMBER: 60/281906 
PRIOR FILING DATE: 2001-04-05 
PRIOR APPLICATION NUMBER: 60/282020 
PRIOR FILING DATE: 2001-04-06 
PRIOR APPLICATION NUMBER: 60/282930 
PRIOR FILING DATE: 2001-04-10 
PRIOR APPLICATION NUMBER: 60/283512 
PRIOR FILING DATE: 2001-04-12 
PRIOR APPLICATION NUMBER: 60/283444 
PRIOR FILING DATE: 2001-04-12 
PRIOR APPLICATION NUMBER: 60/283657 



; PRIOR FILING DATE: 2001-04-13 

; PRIOR APPLICATION NUMBER: 60/283710 

; PRIOR FILING DATE: 2001-04-13 

; PRIOR APPLICATION NUMBER: 60/283678 

; PRIOR FILING DATE: 2001-04-13 

; PRIOR APPLICATION NUMBER: 60/284234 

; PRIOR FILING DATE: 2001-04-17 

; Prior Application data removed - See File Wrapper or PALM. 
; NUMBER OF SEQ ID NOS : 251 
; SEQ ID NO 1 

LENGTH: 2813 

TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE : 

NAME/ KEY: CDS 

LOCATION: (9) . . (2793) 
US-10-114-153-1 

Query Match 95.7%; Score 1782.4; DB 15; Length 2813; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1783; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 9 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 68 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 69 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 128 

Qy 121 ACAGGGC AGAACAAT GAGT CCT GT TCAGGGT CAT CGGACT GCAAGGAGGGT GTCAT C CT G 180 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I 
Db 129 ACAGGGCAGAACAATGAGT CCT GTTCAGGGTCATCGGACTGCAAGGAGGGT GTCAT CCTG 188 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 189 CCAAT CT GGT AC C CGGAGAAC C CT T C CCTT GGGGACAAGATT GCCAGGGT CATT GT CT AT 248 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 249 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 308 

Qy 301 TCTATTGAAGTCAT CACCT CT CAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 309 TCT AT T GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAA 368 

Qy 361 ACC AGCACAAC CACT ATT CGGGT CT GGAAT GAAACT GTCT CCAACCT GACCCTT AT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 369 ACCAGCACAACCACTATTCGGGTCTGGAAT GAAACT GTCTCCAACCTGACCCTTAT GGCC 428 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 429 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 488 



Qy 

Db 



481 AT T GCT GGT GAT CT GGGACCTT CT AC CATT GT AGGGAGT GCAGCCT T CAACAT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I 
489 AT T GCT GGT GAT CT GGGACCTT CTAC CAT T GTAGGGAGT GCAGCCTTCAAC AT GTT C AT C 548 



Qy 541 ATC ATTGGCAT CT GTGT CT ACGTGAT C CCAGACGGAGAGACT CGCAAGAT CAAGC ATCT A 600 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 549 ATC ATT GGC AT CT GTGT CT AC GTGAT CCCAGACGGAGAGACT CGCAAGAT CAAGC ATCT A 608 

Qy 601 C GAGT CT T CTT CAT CAC CGCT GCTT GGAGT AT CT TTGC CT ACAT CT GGCT CT ATAT GATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 609 C GAGT CT T CTT CAT CAC C GCT GCTT GGAGT AT CT TT GC CTACATCT GGCT CTATAT GATT 668 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 669 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 728 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 729 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 788 

Qy 781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 789 ATGCACAAAAAGT ACC GCACAGACAAACACC GAGGAAT TAT CAT AGAGACAGAGGGT GAC 848 

Qy 841 CACC CT AAGGGC ATT GAGAT GGAT GGGAAAAT GAT GAATT CCCAT TT T CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I 
Db 849 CACC CTAAGGGC ATT GAGAT GGAT GGGAAAAT GAT GAATT C CCAT TT T CT AGAT GGGAAC 908 

Qy 901 CT GGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGT CCC GC AGAGAGAT GAT CC GGATTCT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 909 CT GGT GCCCCT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GAT C CGGAT TCT C 968 

Qy 961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTT AGAT C AGCTGGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 969 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTT AGAT C AGCTGGT GGAGAT GGC CAAT 1028 

Qy 1021 TACT AT GCT CT T T C CC ACCAACAGAAGAGCC GC GC CT T CT ACC GT AT C CAAGC CACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1029 TACT AT GCT CT T T C CC ACCAAC AGAAGAGCCGT GC CTT CT ACC GT AT C CAAGC CACTC GT 1088 

Qy 1081 AT GAT GACT GGT GC AGGCAAT AT CCT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1089 ATGATGACTGGTGCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1148 

Qy 1141 T CCAGCAT GAG C GAGGT GCACACC GATGAGCCT GAGGACTTTATTT CCAAGGT CTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1149 T CCAGCAT GAGC GAGGT GCACAC C GAT GAGCCT GAGGACTTTATTT C CAAGGT CTTCTTT 1208 

Qy 1201 GACC CAT GT T CT T ACC AGT GCCT GGAGAACTGT GGGGCT GT ACTCCT GAC AGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1209 GACC CATGTT CT T ACCAGT GC CT GGAGAACT GT GGGGCT GTACTC CT GACAGT GGT GAGG 1268 

Qy 1261 AAAGGGGGAGACATGT CAAAGACCAT GTATGT GGACTACAAAACAGAGGATGGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1269 AAAGGGGGAGACATGT CAAAGACCAT GT ATGTGGACT ACAAAACAGAGGATGGTTCTGCC 1328 



Qy 

Db 



1321 AAT GC AGGGGCT GACT AT GAGTT CACAGAGGGC AC GGT GGT T CT GAAGCCAGGAGAGACC 1380 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
1329 AAT GCAGGGGCTGACTAT GAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1388 



Qy 1381 CAGAAGGAGTTCT CCGTGGGC ATAATT GAT GACGACAT TTTTGAGGAGGAT GAACACTT C 1440 

I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1389 CAGAAGGAGTTCT CCGT GGGC ATAATT GAT GACGAC ATT TTT GAGGAGGAT GAACACTTC 1448 

Qy 1441 TTT GTAAGGTTGAGCAAT GT C CGCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT CCA 1500 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1449 TTT GTAAGGTTGAGCAAT GT C CGCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GC CT CC A 1508 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I \\ I I I I I I 
Db 1509 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1568 

Qy 1561 GTT ACCATCT TGGAT GAT GACC AT GC AGGCAT CTT CACTTTT GAATGT GATACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1569 GTTACCATCTTGGAT GATGACCAT GCAGGCAT CTT CACTTTTGAATGTGATACTATTCAT 1628 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1629 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1688 

Qy 1681 ACAGT CATCGT C CCCT TT AGGACAGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1689 ACAGTCATCGTCCCCTTTAGGACAGT AGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 1748 

Qy 1741 GAAGAC AC AT AT GGGGAGTT GGAAT T CAAGAAT GAT GAAACT GT 1784 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1749 GAAGAC AC AT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT 1792 
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APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
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APPLICANT: Catterton, Elina 
APPLICANT: MacDougall, John 
APPLICANT: Edinger, Shlomit 
APPLICANT: Stone, David 
APPLICANT: Mazur, Ann 

TITLE OF INVENTION: NOVEL ANTIBODIES THAT BIND TO ANTIGENIC POLYPEPTIDES, 
NUCLEIC ACIDS 

TITLE OF INVENTION: ENCODING THE ANTIGENS, AND METHODS OF USE 
FILE REFERENCE: 21402-322A 

CURRENT APPLICATION NUMBER: US/10/114,153 
CURRENT FILING DATE: 2002-08-06 
PRIOR APPLICATION NUMBER: 60/281086 
PRIOR FILING DATE: 2001-04-03 
PRIOR APPLICATION NUMBER: 60/281906 
PRIOR FILING DATE: 2001-04-05 
PRIOR APPLICATION NUMBER: 60/282020 
PRIOR FILING DATE: 2001-04-06 
PRIOR APPLICATION NUMBER: 60/282930 
PRIOR FILING DATE: 2001-04-10 
PRIOR APPLICATION NUMBER: 60/283512 
PRIOR FILING DATE: 2001-04-12 
PRIOR APPLICATION NUMBER: 60/283444 
PRIOR FILING DATE: 2001-04-12 
PRIOR APPLICATION NUMBER: 60/283657 
PRIOR FILING DATE: 2001-04-13 
PRIOR APPLICATION NUMBER: 60/283710 
PRIOR FILING DATE: 2001-04-13 
PRIOR APPLICATION NUMBER: 60/283678 
PRIOR FILING DATE: 2001-04-13 
PRIOR APPLICATION NUMBER: 60/284234 
PRIOR FILING DATE: 2001-04-17 

Prior Application data removed - See File Wrapper or PALM. 
NUMBER OF SEQ ID NOS : 251 
SEQ ID NO 3 
LENGTH: 284 0 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 
NAME/ KEY: CDS 
LOCATION: (63) . . (2838) 
US-10-114-153-3 

Query Match 95.7%; Score 1782.4; DB 15; Length 2840; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1783; Conservative 0; Mismatches 1; Indels 0; Gaps 0 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I II I I I I I I 1 I I I I I I I I I I I I I I I I I I 1 I I I I I II I I I I I I I I I I I I I I I 
Db 63 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 122 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 123 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 182 



Qy 121 ACAGGGC AGAACAAT GAGT C CT GTT CAGGGT CAT CGGACTGCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 183 ACAGGGCAGAACAAT GAGT CCT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 242 



Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 . 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 243 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 302 

Qy 241 TTT GTGGCC CT GATAT ACAT GTTCCTT GGGGT GT C CAT CATT GCT GAC CGCTT CAT GGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 303 TTT GT GGCC CT GATAT ACATGTT CCTT GGGGT GT C CAT CATT GCT GAC CGCTT CAT GGCA 362 

Qy 301 T CT ATT GAAGT CATC ACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 363 T CT ATT GAAGT CATC ACCT CT CAAGAGAGGGAGGT GACAAT TAAGAAACC CAAT GGAGAA 422 

Qy 361 ACCAGC ACAACCACT ATT CGGGT CT GGAAT GAAACT GT CT C CAAC CT GACCCT T AT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 423 ACCAGC ACAACCACT ATT C GGGTCT GGAAT GAAACT GT CTC CAAC CT GAC CCTT AT GGCC 482 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I 
Db 483 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 542 

Qy 481 ATT GCT GGT GAT CTGGGACCT T CT ACCAT T GT AGGGAGT GCAGC CTT CAACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I 
Db 543 ATT GCT GGT GAT CTGGGAC CTT CT AC CATT GT AGGGAGT GCAGC CTT CAACAT GTT CAT C 602 

Qy 541 ATCATTGGCATCTGTGTCTACGTGATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 603 AT C ATT GGCATCT GT GTCT AC GT GATCCC AGAC GGAGAGACT CGCAAGAT CAAGCAT CT A 662 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 663 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 722 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 723 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 782 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 83 T TT C CAGTGT GT GTC CTT CT GGC CT GGGT GGCAGATAAACGACT GCT CTT CTACAAAT AC 842 

Qy 781 ATGCACAAAAAGT AC C GCACAGACAAAC AC C GAGGAATT AT CAT AGAGACAGAGGGTGAC 840 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 843 AT GCACAAAAAGT AC C GCACAGACAAAC ACC GAGGAATT AT C AT AGAGAC AGAGGGT GAC 902 

Qy 841 CAC CCT AAGGGCATT GAGATGGAT GGGAAAAT GAT GAATTC C CAT TTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 903 CACCCTAAGGGCATTGAGATGGATGGGAAAAT GAT GAATTCCCATTTT CTAGATGGGAAC 962 

Qy 901 CTGGTGCCC CT GGAAGGGAAGGAAGT GGAT GAGT CC C GC AGAGAGAT GAT C CGGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 963 CTGGTGC CCCTGGAAGGGAAGGAAGT GGAT GAGT CCCGCAGAGAGAT GATCCGGATT CT C 1022 

Qy 961 AAGGAT CTGAAGCAAAAACAC C C AGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1023 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCT GGT GGAGATGGCCAAT 1082 



Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I -I I I I I I I I I I I I I 
Db 1083 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1142 

Qy 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GC AGC AGAACAAGC CAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1143 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGC AGAACAAGC CAAGAAGGCC 1202 

Qy 1141 T CCAGC ATGAGC GAGGT GC AC ACC GAT GAGC CTGAGGACT T T ATTT C CAAGGT CTT CTTT 1200 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1203 TCCAGCATGAGCGAGGT GCAC ACCGAT GAGC CTGAGGACT TTATTT C CAAGGT CTT CTTT 1262 

Qy 1201 GACCC AT GTT CTT AC C AGT GC CT GGAGAACT GTGGGGCT GT ACT CCT GAC AGT GGT GAGG 1260 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1263 GACCCAT GTT CTTAC CAGT GC CT GGAGAACT GTGGGGCTGT ACT C CT GAC AGT GGT GAGG 1322 

Qy 1261 AAAGGGGGAGACAT GT CAAAGACCAT GT AT GT GGACT ACAAAAC AGAGGAT GGTT CT GC C 1320 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1323 AAAGGGGGAGACAT GT CAAAGACCAT GTAT GT GGACT ACAAAAC AGAGGAT GGTT CT GCC 1382 

Qy 1321 AAT GCAGGGGCT GACT ATGAGTT CACAGAGGGCAC GGT GGTT CT GAAGC C AGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1383 AAT GCAGGGGCT GACT ATGAGTTCACAGAGGGCAC GGT GGT T CT GAAGC C AGGAGAGACC 1442 

Qy 1381 CAGAAGGAGTTCTCCGTGGGCATAATT GATGACGACATTTTT GAGGAGGATGAACACTTC 1440 

I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1443 CAGAAGGAGTTCTCCGTGGGCATAATT GATGACGACATTTTT GAGGAGGAT GAACACTTC 1502 

Qy 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1503 T T TGTAAGGTT GAGCAAT GT C CGCAT AGAGGAGGAGCAGC CAGAGGAGGGGATGCCT CCA 1562 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1563 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1622 

Qy 1561 GTT AC CAT CTT GGAT GAT GAC CAT GC AGGCAT CT T CACTTTT GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1623 GTTACCATCTTGGAT GATGACCAT GCAGGCAT CTT CACTTTT GAAT GT GATACTATTCAT 1682 

Qy 1621 GT CAGT GAGAGT AT T GGT GT T ATGGAGGT CAAGGTT CTGCGGACAT CAGGT GCC CGGGGT 1680 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1683 GT CAGT GAGAGT AT T GGTGT T ATGGAGGT CAAGGTT CT GCGGACAT CAGGT GCCCGGGGT 1742 

Qy 1681 ACAGT CATCGT C CC CT TT AGGACAGTAGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I J I I I I I I I I I I I I I I I I I I I I I I 
Db 1743 ACAGT CAT C GT C CC CTT T AGGACAGT AGAAGGGACAGCCAAGGGTGGCGGT GAGGACTTT 1802 

Qy 1741 GAAGACACATAT GGGGAGTTGGAATT CAAGAATGATGAAACTGT 1784 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1803 GAAGACACATAT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT 1846 - 



RESULT 11 
US-10-114-153-5 

; Sequence 5, Application US/10114153 
; Publication No. US20030185815A1 



GENERAL INFORMATION: 



APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 



Padigaru, Muralidhara 
Shenoy, Suresh 
Kekuda, Ramesh 
Rastelli, Luca 
Mezes, Peter 
Smithson, Glennda 
Guo, Xiaojia 
Gerlach, Valerie 
Casman, Stacie 
Boldog, Ferenc 
Li, Li 

Zerhusen, Bryan 
Tchernev, Velizar 
Gangolli, Esha 
Vernet, Corine 
Spytek, Kimberly 
Malyankar, Uriel 
Patturajan, Meera 
Miller, Charles 
Taupier, Raymond J. Jr. 
Heyes , Mel vyn 
Ju, Jingfang 
Peyman, John 
Catterton, Elina 
MacDougall, John 
Edinger, Shlomit 
Stone, David 
Mazur, Ann 

: NOVEL ANTIBODIES THAT BIND TO ANTIGENIC POLYPEPTIDES, 



APPLICANT 
TITLE OF INVENTION 
NUCLEIC ACIDS 

TITLE OF INVENTION: ENCODING THE ANTIGENS, 
FILE REFERENCE: 21402-322A 

CURRENT APPLICATION NUMBER: US/ 10/ 114 , 153 
CURRENT FILING DATE: 2002-08-06 
PRIOR APPLICATION NUMBER: 60/281086 
PRIOR FILING DATE: 2001-04-03 
PRIOR APPLICATION NUMBER: 60/281906 
PRIOR FILING DATE: 2001-04-05 
PRIOR APPLICATION NUMBER: 60/282020 
PRIOR FILING DATE: 2001-04-06 
PRIOR APPLICATION NUMBER: 60/282930 
PRIOR FILING DATE: 2001-04-10 
PRIOR APPLICATION NUMBER: 60/283512 
PRIOR FILING DATE: 2001-04-12 
PRIOR APPLICATION NUMBER: 60/283444 
PRIOR FILING DATE: 2001-04-12 
PRIOR APPLICATION NUMBER: 60/283657 
PRIOR FILING DATE: 2001-04-13 
PRIOR APPLICATION NUMBER: 60/283710 
PRIOR FILING DATE: 2001-04-13 
PRIOR APPLICATION NUMBER: 60/283678 
PRIOR FILING DATE: 2001-04-13 
PRIOR APPLICATION NUMBER: 60/284234 
PRIOR FILING DATE: 2001-04-17 
Prior Application data removed - See 
NUMBER OF SEQ ID NOS : 251 



AND METHODS OF USE 



File Wrapper or PALM. 



; SEQ ID NO 5 

LENGTH: 2685 

TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE: 

NAME/ KEY: CDS 

LOCATION: (1)..(2685) 
US-10-114-153-5 

Query Match 91.0%; Score 1694.8; DB 15; Length 2685; 

Best Local Similarity 98.2%; Pred. No. 0; 

Matches 1725; Conservative 0; Mismatches 27; Indels 4; Gaps 1; 

Qy 86 GAGCAGAGGCT GGT GGCT C AGGGGACGT GC CAAGCACAGGGCAGAACAAT GAGT CCT GTT 145 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2 GATC C GAGGCT GGT GGCT CAGGGGACGTGCCAAGCACAGGGCAGAACAAT GAGT C CT GTT 61 

Qy 146 CAGGGT CAT C GGACT GCAAGGAGGGT GTCATC CT GCCAAT CT GGT AC CCGGAGAACCCTT 205 

I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 62 CAGGGT CAT C GGACT GCAAGGAGGGT GTCAT C CT GC CAAT CT GGT AC CCGGAGAACCCTT 121 

Qy 206 CCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCC 265 

I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 122 CC CT T GGGGACAAGATT GCCAGGGT C ATT GT CTATT TT GT GGCC CT GAT AT ACAT GTT C C 181 

Qy 266 TT GGGGT GT C CAT C ATT GCT GACC GCT TCAT GGCAT CTATT GAAGT CAT CAC CT CTCAAG 325 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 182 T T GGGGT GT CCAT CAT T GCT GACCGCT T CAT GGCATCTATT GAAGT CAT CAC CT CT CAAG 241 

Qy 326 AGAGGGAGGT GACAAT TAAGAAACC CAAT GGAGAAACCAGCACAACCACT ATT C GGGT CT 385 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 242 AGAGGGAGGT GACAAT TAAGAAACC CAAT GGAGAAACCAGCACAACCACT ATT C GGGT CT 301 

Qy 386 GGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATAC 445 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 302 GGAAT GAAACT GTCT C CAAC CT GAC C CTTAT GGCCCT GGGT T CCTCT GCT C CTGAGATAC 361 

Qy 446 TCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTA 505 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 362 TCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTA 421 

Qy 506 CCATT GT AGGGAGT GCAGCCT T CAACATGTT CAT CAT CAT T GGCAT CTGT GT CT ACGTGA 565 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 422 CCATT GT AGGGAGT GCAGCCT T CAAC AT GTT CAT CAT CAT T GGCAT CT GT GT CTACGTGA 481 

Qy 566 T C CCAGACGGAGAGACT CGCAAGAT CAAGCAT CT ACGAGT CTTCTT CAT CACCGCT GCTT 625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 482 T CCCAGACGGAGAGACT CGCAAGATCAAACAT CTAC GAGT CTTCTTCAT CACCGCT GCTT 541 

Qy 626 GGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGG 685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 542 GGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGG 601 

Qy 686 TCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCT 745 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I 
Db 602 TCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCT 661 



Qy 746 GGGTGGCAGATAAACGACTGCT CT T CT ACAAAT ACAT GC ACAAAAAGT ACCGCACAGACA 805 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I 

Db 662 GGGTGGCAGATAAAC GACT GCT CTT CT ACAAAT ACAT GCACAAAAAGT AC C GCAC AGACA 721 

Qy 806 AACACC GAGGAATT AT CAT AGAGAC AGAGGGTGACCACCCTAAGGGCATT GAGAT GGAT G 865 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 722 AACACCGAGGAATTATCATAGAGACAGAGGGTGACCACCCTAAGGGCATTGAGATGGATG 781 

Qy 866 GGAAAATGATGAATTCCCATTTTCTAGATGGGAACCTGGTGCCCCTGGAAGGGAAGGAAG 925 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I 1 I I I I I I I I I I I I I I 

Db 782 GGAAAAT GAT GAAT T C C CAT T T T CT AG AT GGGAAC CTGGTGCCCCT GGAAGG GAAGGAAG 841 

Qy 926 TGGAT GAGTCCCGCAGAGAGATGAT CCGGATTCT CAAGGATCT GAAGCAAAAACACCCAG 985 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 842 TGGAT GAGTCCCGCAGAGAGAT GAT CCGGATTCT CAAGGATCT GAAGCAAAAACACCCAG 901 

Qy 986 AGAAGGACTT AGATCAGCT GGTGGAGAT GGCCAATTACTATGCTCTTTCCCACCAACAGA 1045 

I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 902 AGAAGGACT T AGAT C AGCT GGT GGAGAT GGC CAATT ACT ATGCTCTTT CCC ACCAACAGA 961 

Qy 1046 AGAGC C GCGCCTTCT AC C GT AT CCAAGC CACTC GT AT GAT GACTGGT GCAGGCAAT AT C C 1105 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 962 AGAGC C GCGCCTT CT AC C GT AT C CAAGC CACTC GT AT GAT GACTGGTGCAGGCAAT AT C C 1021 

Qy 1106 TGAAGAAACAT GC AGCAGAACAAGC CAAGAAGGCCT C CAGCAT GAGCGAGGT GCACAC C G 1165 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1022 T GAAGAAAC AT GC AGCAGAACAAGC CAAGAAGGCCT C CAGCAT GAGCGAGGT GCACAC C G 1081 

Qy 1166 AT GAGCCT GAGGACTTT AT T T CCAAGGT CTT CT T T GACC CAT GTT CTT AC C AGT GC CT GG 1225 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1082 AT GAGCCT GAGGACTTT AT TT C CAAGGT CTT CT T T GACC CAT GTT CTT AC C AGT GC CT GG 1141 

Qy 1226 AGAACTGT GGGGCT GTACTCCT GACAGT GGTGAGGAAAGGGGGAGACAT GTCAAAGACCA 1285 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1142 AGAACT GT GGGGCT GT ACT C CT GACAGT GGT GAGGAAAGGGGGAGACAT GT CAAAGAC C A 1201 

Qy 1286 TGTATGTGGACTACAAAACAGAGGATGGTTCTGCCAATGCAGGGGCTGACTATGAGTTCA 1345 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1202 TGT AT GTGGACTACAAAAC AGAGGAT GGT T CTGC CAAT GCAGGGGCT GACT AT GAGTT C A 1261 

Qy 1346 CAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACCCAGAAGGAGTT CT CCGT GGGCATAA 1405 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1262 CAGAGGGCACGGTGGTT CTGAAGCCAGGAGAGACCCAGAAGGAGTTCTCCGT GGGCATAA 1321 

Qy 1406 TT GAT GAC GAC ATTTTT GAGGAGGAT GAAC ACTT CTTTGT AAGGT T GAGCAAT GT C C GCA 1465 

I I I I I I I I I I I I I I IN I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1322 TT GAT GAC GAC ATT TTT GAGGAG GAT GAAC ACTT CTTT GTAAGGTT GAGCAAT GT C C GCA 1381 

Qy 1466 T AGAGGAGGAGC AGC CAGAGGAGGGGAT GC CT CCAGCAAT ATT CAACAGT CTTCCCTTGC 1525 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1382 T AGAGGAGGAGCAGCCAGAGGAGGGGAT GC CT CCAGCAAT ATT CAACAGT CTT C C CTT GC 1441 

Qy 1526 CTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGATGACCATG 1585 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1442 CTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGATGACCATG 1501 

Qy 1586 C AG GC ATCTTCACT TTT GAAT GT GAT ACT AT T CAT GT CAGTGAGAGT AT T GGT GTT AT GG 1645 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1502 CAGGCAT CTT C ACT TTT GAAT GTGAT ACT ATT CAT GT CAGT GAGAGT ATT GGTGTT ATGG 1561 

Qy 1646 AGGT CAAGGTT CTGC GGACAT CAGGT GCCCGGGGT AC AGT C ATCGT C C CCTTTAGGACAG 1705 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I 
Db 1562 AGGT CAAGGTT CT GC GGACAT CAGGT GCCC GGGGT AC AGT C ATCGT CCC CTTTAGGACAG 1621 

Qy 1706 TAGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT GAAGACACAT AT GGGGAGTT GGAAT 1765 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1622 TAGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT GAAGACACAT AT GGGGAGTT GGAAT 1681 

Qy 1766 TCAAGAATGATGAAACTGTATGTGACAGACAGGAAGCTGACTATGGAAGAAGAGGAGGCC 1825 

I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1682 T C AAG AAT GAT G AAAC TGTGAAAACCATAAGGGTTAAAATAGTAGATGAGGAGGAA 1737 

Qy 1826 AAGAGGATAGCAGAGA 1841 

I I I I I I I 

Db 1738 TACGAAAGGCAAGAGA 1753 



RESULT 12 

US-10-029-386-20265 

Sequence 20265, Application US/10029386 
Publication No. US20030194704A1 
GENERAL INFORMATION : 
APPLICANT: Penn, Sharron G. 
APPLICANT: Rank, David R. 
APPLICANT: Hanzel, David K. 

TITLE OF INVENTION: HUMAN GENOME- DERIVED SINGLE EXON NUCLEIC ACID PROBES 
USEFUL FOR GENE 

TITLE OF INVENTION: EXPRESSION ANALYSIS TWO 
FILE REFERENCE: AEOMICA-X-2 

CURRENT APPLICATION NUMBER: US/10/029,386 
CURRENT FILING DATE: 2001-12-20 
NUMBER OF SEQ ID NOS : 34288 

SOFTWARE: Annomax Sequence Listing Engine vers. 1.1 
SEQ ID NO 20265 
LENGTH: 823 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE: 

OTHER INFORMATION: MAP TO AL160191.1 
OTHER INFORMATION: EXPRESSED IN LUNG, SIGNAL =1.7 
OTHER INFORMATION: EXPRESSED IN FETAL LIVER, SIGNAL =1.7 
OTHER INFORMATION: EXPRESSED IN ADULT LIVER, SIGNAL = 1.6 
OTHER INFORMATION: SWISSPROT HIT: P57103, EVALUE 0.00e+00 
OTHER INFORMATION: EST_HUMAN HIT: BI913344.1, EVALUE 0.00e+00 
OTHER INFORMATION: NT HIT: gil5147253, EVALUE 0.00e+00 
US-10-029-386-20265 

Query Match 44.1%; Score 821.4; DB 15; Length 823; 

Best Local Similarity 99.9%; Pred. No. 1.2e-255; 

Matches 822; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 

Db 



432 TGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGA 491 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I 
1 TGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGA 60 



Qy 492 TCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATCATCATTGGCAT 551 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 T CT GGGACCTTCT AC CAT T GT AGGGAGT GC AGCCT T CAAC AT GTT C AT CAT CATT GGCAT 120 

Qy 552 CT GT GT CT AC GT GAT CCCAGAC GGAGAGACT CGCAAGAT CAAGCATCT AC GAGT CT T CTT 611 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CT GT GT CT AC GT GAT C CCAGACGGAGAGACT C GCAAGAT CAAGCATCT AC GAGT CT TCT T 180 

Qy 612 CAT C ACC GCT GCT TGGAGT AT CT T T GCCT ACAT CT GGCT CT ATAT GATTCT GGCAGT CTT 671 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTT 240 

Qy 672 CTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTG 731 

I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTG 300 

Qy 732 T GT CCT T CT GGC CT GGGT GGC AGATAAACGACT GCT CTT CT ACAAAT ACAT GCACAAAAA 791 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 T GT C CT T CT GGCCTGGGT GGC AGATAAACGACT GCT CT T CT ACAAAT ACAT GCACAAAAA 360 

Qy 792 GTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGACCACCCTAAGGG 851 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 361 GTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGACCACCCTAAGGG 420 

Qy 852 CAT T GAGAT GGAT GGGAAAAT GAT GAATT CCC ATTTT CT AGAT GGGAACCT GGT GCC CCT 911 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CAT T GAGAT GGAT GGGAAAAT GAT GAATT CCCATT TT CTAGATGGGAACCT GGT GCC CCT 480 

Qy 912 GGAAGGGAAGGAAGT GGAT GAGTCC CGC AGAGAGAT GAT C C GGAT TCT CAAGGATCT GAA 971 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 GGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGAT CCGGATTCT CAAGGATCTGAA 540 

Qy 972 GCAAAAACACCCAGAGAAGGACTTAGATCAGCT GGTGGAGAT GGCCAATTACTATGCTCT 1031 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 541 GCAAAAACAC CCAGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC CAATT ACTATGCTCT 600 

Qy 1032 TT CCCAC CAACAGAAGAGC CGCGC CTT CT ACC GT AT CCAAGC CACTC GTAT GAT GACTGG 1091 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 601 TT CCCAC CAACAGAAGAGC CGT GC CT T CT AC C GTAT CCAAGC CACT C GTAT GAT GACT GG 660 

Qy 1092 T GCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCCT C CAGCATGAG 1151 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 T GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCCT C CAGCAT GAG 720 

Qy 1152 C GAGGT GCAC AC C GAT GAGC CT GAGGACT TT ATTT C CAAGGT CTT CTT.TGACC CAT GTT C 1211 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 C GAGGT GCAC AC C GAT GAGCCT GAGGACT TT ATTT CCAAGGT CTT CTTTGACC CAT GTT C 780 

Qy 1212 T T AC C AGTGC CT GGAGAACT GT GGGGCT GT ACT CCT GACAGT G 1254 

II I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 781 TTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTG 823 



RESULT 13 
US-09-901-419-1 

; Sequence 1, Application US/09901419 



Patent No. US20020069421A1 
GENERAL INFORMATION: 
APPLICANT: The Curators of the University of Missouri 

TITLE OF INVENTION: LARGE SCALE EXPRESSION AND PURIFICATION OF RECOMBINANT 
TITLE OF INVENTION: PROTEINS 
FILE REFERENCE: UM01531.1 

CURRENT APPLICATION NUMBER: US/09/901,419 
CURRENT FILING DATE: 2001-07-09 
PRIOR APPLICATION NUMBER: 60/218,125 
PRIOR FILING DATE: 2000-01-13 
NUMBER OF SEQ ID NOS : 2 
SOFTWARE: Patentln Ver. 2.1 
SEQ ID NO 1 
LENGTH: 4087 
TYPE: DNA 

ORGANISM: Bos taurus 
FEATURE: 
NAME/ KEY: CDS 
LOCATION: (268) . . (3180) 
NAME/KEY: sig_peptide 
LOCATION: (268) . . (363) 
NAME/KEY: mis cofeature 
LOCATION: (3178) 

OTHER INFORMATION: A Poly (H) affinity tag comprising 6 His residues 
OTHER INFORMATION: have been inserted at the C-Terminus end of the 
OTHER INFORMATION: coding region of the protein 
US-09-901-419-1 

Query Match 43.5%; Score 810.6; DB 9; Length 4087; 

Best Local Similarity 68.5%; Pred. No. 9.8e-252; 

Matches 1211; Conservative 0; Mismatches 519; Indels 39; Gaps 5; 

Qy 46 TTTGGGCTGGTTACCTTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCA 105 

III I I I I I I I II I I I I I II I I III 

Db 307 TTT C ACGT GATAGCCATGGTGGCT CT CTT GTT T T C C CAT GT GGACCAT ATAAGT GCT GAG 366 

Qy 106 GGGGAC GT GCCAAGCACAGGGC AGAACAAT GAGT C CT GT T CAGGGT CAT C GGACT GCAAG 165 

II II II III I MM I I I I II I I I II I I I I I 

Db 367 AC AGAAAT GGAAGGAGAAGGCAAC GAGACT GGC GAGT GT ACT GGCT C CT ATT ACT GTAAG 426 

Qy 166 GAGGGTGT CAT CCT GCCAAT CT GGT AC CCGGAGAAC CCT T C CCTTGGGGACAAGATT GCC 225 

I I I I I I I I I II II III I II I I I II I I I I I I I I I I I I I I I I I I I 
Db 427 AAGGGGGTGATTTTACCCATTTGGGAGCCCCAGGACCCTTCCTTTGGAGACAAAATTGCT 486 

Qy 226 AGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCT 285 

III I I I I I I I I III I I I I I II I I I I I I I I I I I I I I II II I I I I I I I I I 
Db 487 AGAGC GACT GT GT AT TTT GTGGC CAT GGT CTAC AT GTTT CTT GGAGT CT CAATCATT GCT 546 

Qy 286 GAC CGCT T CAT GGC AT CT ATT GAAGT CAT C AC CTCT CAAGAGAGGGAGGT GACAATT AAG 345 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 547 GAC CGGT T CAT GT C CT CT AT AGAAGT CAT CAC GTCT CAAGAGAAAGAAAT C ACC ATAAAG 606 

Qy 346 AAAC C CAATGGAGAAACCAGCACAACCACT ATT CGGGTCT GGAATGAAACT GT CT CCAAC 405 

I I I I II I I I II I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 607 AAAC C C AAT G GAG AGAC C ACCAAG AC AAC T GT GAGGAT CT GGAAT GAG AC AGT GT C C AAC 666 



Qy 



406 CTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTG 465 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



667 



I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I II I I I I I I I I I I 

CT GAC CTT GAT GGCC CT GGGGT CTT CAGCT CCAGAGATT CT CCTTT CAGTAATC GAGGT G 



466 T GT GGT C AT GGGTT CAT T GCT GGT GAT CT GGGACCTT CT ACCATTGTAGGGAGT GCAGC C 

I I I I I III I I I I III II II II II III I I I I I II I I I I I I I I II 
727 TGT GGCC ATAACT T CACT GCAGGAGACCTT GGCCCT AGC ACC AT CGT GGGGAGT GCT GCA 

526 TT CAAC AT GT T CAT CAT CATT GGCAT CTGT GT CTAC GT GAT CCCAGACGGAGAGACT CGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I II II I I I I I I 
787 TT CAAC AT GT T CAT CAT CATT GCCCTTT GT GT GT AT GT CGT CCC GGAT GGGGAGACAAGG 

586 AAGAT CAAGCAT CT ACGAGTCT T CTT CAT CACC GCT GCTT GGAGTATCTTT GCCTAC ATC 
I I I I I I I I I I I I I I II II I I I I I I II II II I I I I I I I I I I I I I I I I I I 
847 AAGAT CAAGCAT CT GCGT GT GT T CTTT GT GACAGCAGCAT GGAGCAT CTT T GCCT AT AC C 



646 



907 



706 



967 



766 



TGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTC 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
TGGCTTTACATCATTTTGTCTGTCAGCTCCCCT GGGGT CGT GGAGGTCTGGGAAGGTTTG 



726 



525 



786 



585 



846 



645 



906 



705 



966 



765 



CTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
CTTACTTTCTTCTTCTTCCCCATCTGCGTTGTGTTTGCTTGGGTGGCAGACAGGAGGCTT 1026 



825 



CT CTT CTACAAAT AC AT GCACAAAAAGT AC CGCACAGACAAACACCGAGGAATT AT C ATA 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
1027 CTGTTTTACAAGTATGTCTACAAGAGGTATCGGGCTGGCAAGCAGAGGGGAATGATTATT 1086 



826 



876 



GAGACAGAGGGT GACCAC CC TAAGGGC ATT GAGAT GGAT GGGAAAAT GAT G 

II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

1087 GAACACGAAGGAGACAGGC CAT CTT CCAAGACAGAAAT T GAAAT GGAT GGGAAAGTGGT C 1146 



877 



921 



AATTCCCA TTTTCTAGATGGGAACCTGGTGCCCCTGGAAGGGAAG 

I I I I I I I I Ml II II II I I I I I I I I II I II 

1147 AAT T C CC ATGTT GAC AGTTTCT T AGAT GGAGC C CT GGT T CT GGAGGTT GAT GAGAGGGAC 1206 

922 GAAGT GGAT GAGT CCCGCAGAGAGAT GAT C CGGATTCT CAAGGAT CTGAAGCAAAAA 978 

III I I I I III II I I I I I I I I I I I I I I I I I I I I I I I I I I 

1207 C AAGAT GAT GAAGAAGCCAGGC GAGAAAT GGCT AGGATTCT GAAGGAACT CAAGCAGAAG 1266 

979 CACCCAGAGAAGGACTTAGAT CAGCT GGT GGAGAT GGCCAATTACTATGCTCTTT CCCAC 1038 

I I I I II I I I I I I I I I I I I I I III I I I I I I I I I I I I I II 

1267 CAT CC AGAGAAGGAAAT AGAGCAAT T AAT AGAATT AGC CAATTACCAAGT CT TAAGT C AG 1326 

1039 CAACAGAAGAGC CGC GCCT TCT ACCGT AT C CAAGC CACT C GT AT GAT GACT GGT GCAGGC 1098 

II II II II II II II I I II I I I I I I I II II II I I I I I I I II I I I I I I 
1327 CAGCAAAAAAGT CGAGCGTTTT AC CGT ATT CAAGCT ACCCGCCT GAT GACCGGAGCAGGC 1386 

1099 AATATCCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCCTCCAGCATGAGC GAGGT G 1158 

I I II I I I I I I I II I II I I II I I I I I I I I I I I I I I I II II I I I I I 
1387 AACATTT TAAAGAGGCAT GCAGCAGAC CAAGC CAGGAAAGCTGT CAGCAT GC AT GAGGT C 1446 

1159 CACACCGATGAGCCTG AGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTAC 1215 

I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I III 

1447 AACAC GGAAGT GGCT GAAAAT GACCCT GT CAGT AAGAT CTT CTTT GAACAAGGGACAT AT 1506 



1216 CAGT GCCT GGAGAACT GTGGGGCT GTACT CCTGACAGTGGTGAGGAAAGGGGGAGACATG 
I III I I I I I I I I I I I I I I I I I I I MINI I I I I I I I I I I I II 



1275 



Db 1507 C AGT GT CT GGAGAACT GT GGC ACAGT AGCCCT GACCATT AT CC GCAGAGGT GGTGATTTG 1566 

Qy 1276 T CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CTGCCAAT GCAGGGGCTGAC 1335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II 
Db 1567 ACCAAC ACT GT GTTT GT T GACTT C AGAACAGAGGAT GGCACAGCCAAT GCT GGAT CTGAT 1626 

Qy 1336 TAT GAGTT CAC AGAGGGCACGGT GGT T CT GAAGC C AGGAGAGACC CAGAAGGAGT T CT C C 1395 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II 

Db 1627 T AC GAATTT AC C GAAGGAACT GTGGT CTT TAAGC CTGGT GAGACCCAGAAGGAAAT CAGA 1686 

Qy 1396 GT GGGCATAATT GATGAC GACATTTT TGAGGAGGATGAACACTTCTTT GT AAGGTT GAGC 1455 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I II I Ml 

Db 1687 GTT GGCAT CAT T GAT GAT GACATCTTT GAGGAGGATGAGAATTTCCTT GT GCAT CT CAGC 1746 

Qy 1456 AAT GT CCGC AT AGAGGAGGAGC AGCC AGAGGAGGGGAT GCCT C CAGCAAT ATT CAACAGT 1515 

I I I I I II III I I I I I I I I I I III I I I I 

Db 1747 AAC GT CAAAGT AT CTTT GGAAGCCT CGGAAGAC GGCAT CCTGGAAGC CAGT 1797 

Qy 1516 CTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGAT 1575 

II II II III I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1798 CATGTCTCTACCCTTGCTTGCCTGGGATCCCCCTCCACTGCCACCGTGACTATTTTTGAT 1857 

Qy 1576 GAT GACCAT GCAGGCAT CTTC ACTTTT GAAT GT GAT ACT ATT CAT GT CAGT GAGAGTATT 1635 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I III 

Db 1858 GAT GACCAT GCT GGCAT CTTT ACT TTT GAGGAACCGGT GACT CAT GT GAGT GAGAGCATT 1917 

Qy 1636 GGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCC 1695 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1918 GGCAT CAT GGAGGT GAAAGTT CTGAGAACATCT GGAGCACGT GGAAAT GTT AT C GTTCCC 1977 

Qy 1696 TTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTTGAAGACACATATGGG 1755 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II 
Db 1978 T ATAAGAC C ATT GAGGGGACCGCCAGAGGT GGAGGGGAGGACT TT GAGGAC AC AT GCGGA 2037 

Qy 1756 GAGT T GGAAT T CAAGAAT GAT GAAACT GT 1784 

III I II III I I I I I I I I I I I III 

Db 2038 GAGCTCGAGTT CCAGAATGACGAAATT GT 2066 



RESULT 14 

US-09-864-761-16939 

; Sequence 16939, Application US/09864761 

; Patent No. US20020048763A1 

; GENERAL INFORMATION: 

; APPLICANT: Penn, Sharron G. 

; .APPLICANT: Rank, David R. 

; APPLICANT: Hanzel, David K. 
; APPLICANT: Chen, Wensheng 

; TITLE OF INVENTION: HUMAN GENOME- DERIVED SINGLE EXON NUCLEIC ACID PROBES 
USEFUL FOR 

; TITLE OF INVENTION: GENE EXPRESSION ANALYSIS BY MICROARRAY 

; FILE REFERENCE: Aeomica-X-1 

; CURRENT APPLICATION NUMBER: US/09/8 64 , 761 

; CURRENT FILING DATE: 2001-05-23 

; PRIOR APPLICATION NUMBER: US 60/180,312 

; PRIOR FILING DATE: 2000-02-04 

; PRIOR APPLICATION NUMBER: US 60/207,456 



PRIOR FILING DATE: 2000-05-26 

PRIOR APPLICATION NUMBER: US 09/632,366 

PRIOR FILING DATE: 2000-08-03 

PRIOR APPLICATION NUMBER: GB 24263.6 

PRIOR FILING DATE: 2000-10-04 

PRIOR APPLICATION NUMBER: US 60/236,359 

PRIOR FILING DATE: 2000-09-27 

PRIOR APPLICATION NUMBER: PCT/US01/00666 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00667 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00664 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00669 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00665 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00668 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00663 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00662 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/ 00661 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: PCT/US01/00670 

PRIOR FILING DATE: 2001-01-30 

PRIOR APPLICATION NUMBER: US 60/234,687 

PRIOR FILING DATE: 2000-09-21 

PRIOR APPLICATION NUMBER: US 09/608,408 

PRIOR FILING DATE: 2000-06-30 

PRIOR APPLICATION NUMBER: US 09/774,203 

PRIOR FILING DATE: 2001-01-29 

NUMBER OF SEQ ID NOS : 49117 

SOFTWARE: Annomax Sequence Listing Engine vers. 1.1 
SEQ ID NO 16939 
LENGTH: 1836 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE: 

MAP TO AC007281.3 

EXPRESSED IN FETAL LIVER, SIGNAL = 0.64 
EXPRESSED IN HELA, SIGNAL =0.68 
EXPRESSED IN ADULT. LIVER, SIGNAL = 0.69 
EXPRESSED IN HEART, SIGNAL =6.1 
EXPRESSED IN LUNG, SIGNAL = 0.83 
EXPRESSED IN BRAIN, SIGNAL = 1.3 
EXPRESSED IN PLACENTA, SIGNAL =0.68 
NT HIT: X91213.1, EVALUE 0.00e+00 
EST_HUMAN HIT: AW452398.1, EVALUE 0.00e+00 
SWISSPROT HIT: P32418, EVALUE 0.00e+00 



OTHER INFORMATION 
OTHER INFORMATION 
OTHER INFORMATION 
OTHER INFORMATION 
OTHER INFORMATION 
OTHER INFORMATION 
OTHER INFORMATION 
OTHER INFORMATION 
OTHER INFORMATION 
OTHER INFORMATION 
OTHER INFORMATION 
US-09-864-761-16939 



Query Match 42.1%; Score 785.2; DB 9 

Best Local Similarity 68.3%; Pred. No. l.le-243 
Matches 1166; Conservative 0; Mismatches 503 



Length 1836; 
Indels 39; Gaps 



4; 



Qy 109 GAC GT GC CAAGC ACAGGGCAGAACAAT GAGT CCT GTTCAGGGT CAT C GGACT GCAAGGAG 168 

II II II INI I I I I I I I I I I I I I I I I I I I II I 

Db 133 GAAAT GGAAGGAGAAGGAAATGAAACTGGTGAATGTACTGGATCATATTACT GTAAGAAA 192 

Qy 169 GGT GT CAT C CT GC CAAT CT GGTACC C GGAGAACC CTT C CCTTGGGGACAAGATT GCCAGG 228 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 193 GGGGTGATTTTGCCCATTTGGGAACCCCAAGACCCTTCTTTTGGGGACAAAATTGCTAGA 252 

Qy 229 GT CAT T GT CTAT TT T GT GGC C CT GAT AT ACAT GTTCCTT GGGGT GT C CAT CAT T GCT GAC 288 

I I III I I I I II I I I II I II I I I I I I I II I I I II II II I I I I I I I I I I 

Db 253 GCTACTGTGTATTTTGTGGCCATGGTCTACATGTTTCTTGGAGTCTCTATCATAGCTGAT 312 

Qy 289 C GCTT CAT GGCAT CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAATTAAGAAA 348 

I I I I I I I I I I I I I I II I I II I I I I I I I I I II I I I II I I I I I I I I I I I 

Db 313 CGGTT CATGT CCTCT ATAGAAGTCAT CACATCTCAAGAAAAAGAAATAACCATAAAGAAA 372 

Qy 349 C CCAAT GGAGAAAC C AGCACAACCACT ATTCGGGT CTGGAAT GAAACT GT CT C CAAC CT G 408 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 373 C CCAAT GGAGAGAC CACCAAGACAACT GT GAGGAT CTGGAAT GAAACAGTTT CTAAC CT G 432 

Qy 409 ACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGT 468 

III I I I II I I I I II I II I I I I I M.I I I I I I I Mill II I I I I I I I MUM 

Db 433 ACCTTGATGGCCCTGGGATCTTCTGCTCCTGAGATTCTCCTTTCAGTAATTGAAGTGTGT 492 

Qy 469 GGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTC 528 

II Ml MM III II II II II Ml Mill II II I I I I I II II I 

Db 493 GGCCATAACTTCACTGCAGGAGACCTCGGTCCTAGCACCATCGTGGGAAGTGCTGCATTC 552 

Qy 529 AAC AT GT T CAT CAT CAT T GGC AT CT GT GT CT AC GT GAT CCCAGACGGAGAGACTCGCAAG 588 

I I I I M II I I I II I II I M I II I I I I II I I II I II I I II II I I I II I 

Db 553 AAT AT GTT CATC ATT AT T GCACTCT GT GTTT AT GT GGT GCCT GACGGAGAGACAAGGAAG 612 

Qy 589 ATCAAGCATCTACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGG 648 

II I I I II I I M I I I I I I M I II II II I II II I II I I II II I M I MM 

Db 613 ATTAAGCATTTGCGTGTCTTCTTTGTGACAGCAGCCTGGAGCATCTTTGCCTACACCTGG 672 

Qy 649 CTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTC 708 

II II I I II I I I I I II I M II I I I I I I I I II I I I I I II I II III 

Db 673 CTTTACATTATTTTGTCTGTCATATCTCCTGGTGTTGTGGAGGTCTGGGAAGGTTTGCTT 732 

Qy 709 ACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTC 768 

I I I I I I II M I II II I I II II I I I II I I II I II II II I I II I I 

Db 733 ACTTTCTTCTTCTTTCCCATCTGTGTTGTGTTCGCTTGGGTAGCGGATAGGAGACTTCTG 792 

Qy 769 T TCTACAAAT AC AT GCACAAAAAGT AC C GCAC AGACAAAC ACCGAGGAATT AT CAT AGAG 828 

II I I III. II I II I I I II I I I I I I II II I II I I II I I II 

Db 793 T TTTACAAGT AT GT CTACAAGAGGT AT C GAGCT GGCAAGCAGAGGGGGAT GATT ATT GAA 852 

Qy 829 ACAGAGGGT GAC CAC C C TAAGGGC ATT GAGAT GGAT GGGAAAAT GATGAAT 879 

I I I I II I II I I II I I I I II II I II II I I I I I II 

Db 853 CAT GAAGGAGAC AGGCCAT CTT CTAAGACT GAAATT GAAAT GGACGGGAAAGT GGT CAAT 912 

Qy 880 TCCCATTTTCTAGATGGGAACCTGGTGCCCCTGGAAGGGAAG 921 

I I I I I II I I I I I II II III 

Db 913 T CT CAT GTT GAAAAT TT CTT AGAT GGT GCTCT GGTT CT GGAGGT GGAT GAGAGGGACCAA 972 

Qy 922 GAAGT GGAT GAGT C C C GCAGAGAGAT GAT CCGGATT CT CAAGGAT CT GAAGCAAAAACAC 981 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



973 



982 



III I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
GAT GAT GAAGAAGCT AGGCGAGAAAT GGCTAGGATT CT GAAGGAACT TAAGCAGAAGCAT 



1032 



CCAGAGAAGGACT TAGAT CAGCT GGTGGAGATGGC CAATT ACT AT GCT CTTTC C C ACCAA 1041 

I I I I I I I I I I I I I I I I III I I I I I I I I I I II MM 

1033 CCAGATAAAGAAAT AGAGCAAT TAATAGAATT AGCTAACT ACCAAGT CCTAAGT CAGCAG 1092 

1042 CAGAAGAGCC GCGCCTT CTACCGT AT CCAAGCCACT CGT AT GAT GACT GGT GCAGGCAAT 1101 

MUM I I I M I I I I I I I I I II I I I I I I I M I II I I M M M I 
1093 CAAAAAAGT AGAGCAT T TT AT CGCATT CAAGCT ACT CGC CT CAT GACT GGAGCT GGCAAC 1152 

1102 ATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCCTCCAGCATGAGCGAGGTGCAC 1161 

II I I I I I I II I I I I I I I I I I I I I I I I I II I I II I I I I I I I II II 
ATT TTAAAGAGGCAT GCAGCT GACCAAGCAAGGAAGGCT GT C AGC AT GCACGAGGT CAAC 1212 



1153 



1162 ACCGATGAGCCTG AGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAG 1218 

I I I I I I I II I I I I III M I I I I II I I I M I I I I I I I M 
1213 ACT GAAGT GACT GAAAAT GAC C CT GT T AGTAAGAT CT T CTTT GAACAAGGGACAT AT CAG 1272 

1219 TGC CT GGAGAACT GT GGGGCT GT ACT C CTGACAGT GGT GAGGAAAGGGGGAGACAT GT CA 1278 

II II I I M I II I I I I I I I II II I II I I I I I II I I I I III 

1273 TGT CT GGAGAACT GT GGT ACT GT GGC C CTT ACC ATT AT CC GCAGAGGT GGT GATTT GACT 1332 

1279 AAGACCAT GT AT GT GGACTACAAAAC AGAGGAT GGTT CTGC CAAT GCAGGGGCT GACT AT 1338 

II M Ml III I I I I II I II I I I I M I II I II I I I I I II I II I I I I I 

1333 AACACT GT GT TT GTT GACTT C AGAACAGAGGAT GGCACAGCAAAT GCT GGGTCT GATT AT 1392 

1339 GAGTT CAC AGAGGGCAC GGT GGTT CT GAAGC CAGGAGAGACCCAGAAGGAGTT CTCCGTG 1398 
II II M M II I I I I I I I I II I II I I I I II II I II I I I I II III 

GAATT T ACT GAAGGAACT GT GGT GT TTAAGCCT GGT GATACCCAGAAGGAAAT CAGAGT G 1452 



1393 



1399 GGC ATAATT GAT GAC GACATTTTT GAGGAGGAT GAAC ACT T CTT T GTAAGGTT GAGCAAT 1458 

II II II I I I I I II II I I I I I M M I I I II I I III I II I I I II I I I 
1453 GGTATCATAGAT GATGATATCTTTGAGGAGGATGAAAATTTCCTT GTGCAT CTCAGCAAT 1512 

1459 GT CC GCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GC CTCCAGCAAT ATT CAACAGT CTT 1518 

III II M I I I I II I I I I I III II II I 
1513 GTCAAAGTATCTTCTGAAGCTTCAGAAGATGGCATACTGGAAGC CAATCAT 1563 

1519 CCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGAT 1578 
I II III I I I I II II I II I I I II I I I I I I I I II I I 

GT TT CTACACTT GCTTGC CT CGGAT CT C CCT CCACT GCCACTGTAACT AT TTTT GAT GAT 



1564 



1623 



1579 GACCATGCAGGCAT CTTCACTTTTGAATGTGATACTATTCATGTCAGT GAGAGTATTGGT 1638 

I I I I I I I II I I II II II I II II I I I MUM II I I I I II I I I I I 

1624 GACCACGC AG GCAT TTTT ACT TT T GAGGAAC CT GT GACT CATGT GAGT GAGAGCAT T GGC 1683 

1639 GTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGT CAT CGT CCC CTTT 1698 

I II I II I I I II I I II I I I I I I I I I I II II I I I I I I II I I I I 
1684 AT C AT GGAGGT GAAAGT ATT GAGAACAT CT GGAGCT CGAGGAAAT GT TAT C GTT C CAT AT 1743 

1699 AGGACAGT AGAAGGGACAGC CAAGGGT GGC GGT GAGGACTTT GAAGACACATAT GGGGAG 1758 

I II I I I I I I I I I II I I II I II I I I I I II I I II I I I II I I I I I I I I 
1744 AAAAC CAT C GAAGGGACT GC CAGAGGT GGAGGGGAGGATTT T GAGGACACTT GT GGAGAG 1803 



Qy 



1759 TT GGAATT CAAGAAT GAT GAAACT GTAT 1786 
I II II II II I II I I II II I III I 



Db 1804 CT CGAATT CC AGAAT GAT GAAATT GT GT 1831 



RESULT 15 

US-10-357-930-24294 

; Sequence 24294 , Application US/10357930 

; Publication No. US20040259086A1 

; GENERAL INFORMATION: 

; APPLICANT: Schlegel . Robert 

; APPLICANT: Endege, Wilson 

; APPLICANT: Monahan, John 

; TITLE OF INVENTION: NOVEL GENES, COMPOSITIONS, KITS, AND METHODS FOR 

; TITLE OF INVENTION: IDENTIFICATION, ASSESSMENT, PREVENTION, AND THERAPY OF 

; TITLE OF INVENTION: HUMAN PROSTATE CANCER 

; FILE REFERENCE: MRI-007BCN 

; CURRENT APPLICATION NUMBER: US/10/357,930 

; CURRENT FILING DATE: 2003-02-04 

; PRIOR APPLICATION NUMBER: 09/785,276 

; PRIOR FILING DATE: 2003-02-16 

; PRIOR APPLICATION NUMBER: 60/183,319 

; PRIOR FILING DATE: 2000-02-17 

; PRIOR APPLICATION NUMBER: 60/189,862 

; PRIOR FILING DATE: 2000-03-16 

; PRIOR APPLICATION NUMBER: 60/207,454 

; PRIOR FILING DATE: 2000-05-25 

; PRIOR APPLICATION NUMBER: 60/211,314 

; PRIOR FILING DATE: 2000-06-09 

; PRIOR APPLICATION NUMBER: 60/219,007 

; PRIOR FILING DATE: 2000-07-18 

; PRIOR APPLICATION NUMBER: 60/255,281 

; PRIOR FILING DATE: 2000-12-13 

; NUMBER OF SEQ ID NOS : 62232 

; SOFTWARE: FastSEQ for Windows Version 4.0 

; SEQ ID NO 24294 

; LENGTH: 5438 

TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE: 

NAME/ KEY : misc_feature 
; LOCATION: 1, 2, 3, 4, 5437, 5438 

OTHER INFORMATION: n = A,T,C or G 
US-10-357-930-24294 

Query Match 42.1%; Score 784.8; DB 18; Length 5438; 

Best Local Similarity 68.3%; Pred. No. 2.9e-243; 

Matches 1165; Conservative 0; Mismatches 502; Indels 39; Gaps 4 

Qy 109 GAC GT GC CAAGCAC AGGGCAGAACAAT GAGT C CT GT T C AGGGT CAT C GGACT GCAAGGAG 168 

II II II III I I I I I I I I I I I I I I I I I I I I I I I 

Db 245 GAAAT GGAAGGAGAAGGAAAT GAAACT GGT GAATGT ACT GGAT CAT ATT ACT GTAAGAAA 304 

Qy 169 GGT GT CAT CCT GC CAATCT GGT AC C CGGAGAACCCTT C CCTTGGGGACAAGATT GCCAGG 228 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 305 GGGGTGATTTTGCCCATTTGGGAACCCCAAGACCCTTCTTTTGGGGACAAAATTGCTAGA 364 

Qy 229 GTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGAC 288 

I I III I I I I I I I I I I I I II I I II I I I I I I I II I II II I I I I I I I I I I 



Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 
Db 



365 GCTACTGTGTATTTTGTGGCCATGGTCTACATGTTTCTTGGAGTCTCTATCATAGCTGAT 424 

289 C GCTT CAT GGCAT CTATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAA 348 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I II I I I I I I I I I I I 
425 CGGTTCATGTCCTCTATAGAAGTCAT CACAT CTCAAGAAAAAGAAATAACCATAAAGAAA 484 

349 CCCAAT GGAGAAAC CAGC ACAACCACT ATT CGGGT CT GGAAT GAAACT GT CT C CAACCT G 408 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
485 CCCAAT GGAGAGAC CACCAAGACAACTGT GAGGAT CT GGAAT GAAACAGTTT CTAACCT G 544 



409 



545 



469 



605 



529 



665 



589 



725 



649 



785 



709 



845 



769 



905 



829 



965 



880 



ACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGT 468 
III I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I 
ACCT T GAT GGC C CT GGGAT CT T CT GCT CCTGAGAT T CT CCTT T CAGTAATT GAAGT GT GT 604 

GGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTC 52 8 

II III I I I I III II II II II III I I I I I II II I I I I I II III 

GGC CAT AACTT CACT GCAGGAGACCT C GGT CCT AGCAC CAT CGT GGGAAGT GCT GC ATT C 664 

AACAT GTTCATCAT CATT GGCATCTGT GT CTACGTGATCCCAGACGGAGAGACTCGCAAG 588 
II I I I I I I I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I III 
AATAT GTT CAT CAT TATT GCACTCT GT GT TTAT GT GGT GC CT GACGGAGAGACAAGGAAG 724 

ATCAAGCATCTACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGG 64 8 
II I I I I I I I II I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I 
ATTAAGCATTTGCGTGTCTTCTTTGTGACAGCAGCCTGGAGCATCTTTGCCTACACCTGG 784 

CTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTC 708 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
CTTTACATTATTTTGTCTGTCATATCTCCTGGTGTTGTGGAGGTCTGGGAAGGTTTGCTT 844 

ACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTC 768 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
ACTTTCTTCTTCTTTCCCATCTGTGTTGTGTTCGCTTGGGTAGCGGATAGGAGACTTCTG 904 

T TCT ACAAATAC AT GC ACAAAAAGT ACCGCAC AGACAAACAC C GAGGAATT AT CAT AGAG 828 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTT T ACAAGTAT GT CT ACAAGAGGT AT CGAGCT GGCAAGCAGAGGGGGAT GATT ATTGAA 964 

AC AG AG GGT G AC CAC C C TAAGGGCATTGAGATGGATGGGAAAATGATGAAT 879 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

CAT GAAGGAGAC AGGC CAT CT T CTAAGACT GAAAT T GAAAT GGAC GGGAAAGT GGT CAAT 1024 



921 



TCCCATTTTCTAGATGGGAACCTGGTGCCCCTGGAAGGGAAG 

I I I I I I I I I I I I I I I I III 

1025 T CT CAT GT T GAAAATT T CTT AGAT GGT GCT CT GGT TCT GGAGGTGGAT GAGAGGGACCAA 1084 



922 



981 



GAAGTGGAT GAGTCCCGCAGAGAGATGAT CCGGATTCTCAAGGATCTGAAGCAAAAACAC 
III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1085 GAT GAT GAAGAAGCT AGGCGAGAAAT GGCT AGGAT TCT GAAGGAACTTAAGCAGAAGCAT 1144 

982 CCAGAGAAGGACTT AGAT CAGCTGGT GGAGAT GGC CAATTACT AT GCT CTTTCC CACCAA 1041 
I I I I I I I I I I I I I I I I III I I I I I I I I I I II I I I I 

1145 CCAGATAAAGAAAT AGAGCAATT AAT AGAATT AGCTAACT ACCAAGT CCTAAGT CAGCAG 1204 

1042 C AGAAGAGC C GC GCCT T CT ACCGT AT C CAAGC CACT C GT AT GAT GACT GGT GCAGGCAAT 1101 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAAAAAAGT AGAGCAT TTT AT C GCATT CAAGCT ACTC GC CTCAT GACT GGAGCTGGCAAC 1264 



1205 



Qy 

Db 



1102 ATC CT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGC CT CCAGCAT GAGC GAGGTGCAC 1161 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1265 ATTTTAAAGAGGCATGCAGCT GAC CAAGCAAGGAAGGCT GT CAGCAT GCAC GAGGTCAAC 1324 



Qy 1162 ACCGATGAGCCTG AGGACTTT AT T TCCAAGGT CTT CT TT GAC CCATGT T CTT ACCAG 1218 

I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I 
Db 1325 ACT GAAGTGACTGAAAATGACCCT GTTAGTAAGATCTTCTTTGAACAAGGGACATATCAG 1384 

Qy 1219 T GCCT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGTGAGGAAAGGGGGAGACAT GT CA 1278 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II II III 
Db 1385 T GT CT GGAGAACT GTGGT ACT GT GGCCCT T AC CATT AT C CGCAGAGGT GGT GAT TT GACT 1444 

Qy 1279 AAGACC AT GTAT GT GGACT ACAAAAC AGAGGAT GGTT CT GCCAAT GCAGGGGCTGACT AT 1338 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1445 AACACT GT GTTT GT TGACTTCAGAAC AGAGGAT GGCACAGCAAAT GCT GGGT CT GATT AT 1504 

Qy 1339 GAGTT CAC AGAGGGC ACGGTGGTT CT GAAGCCAGGAGAGACCCAGAAGGAGTT CT C CGT G 1398 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 

Db 1505 GAATTT ACT GAAGGAACT GT GGTGT TTAAGCCT GGTGAT ACCCAGAAGGAAAT C AGAGT G 1564 

Qy 1399 GGCAT AATT GAT GACGACATTTTT GAGGAGGAT GAACACTT CTTT GTAAGGTT GAGCAAT 1458 

II II II Mill II II I I I I I I II I I I I I I I I III I I I I I I I I I I I 

Db 1565 GGT AT CATAGAT GATGATATCTTT GAGGAGGATGAAAATTTCCTTGT GCAT CTCAGCAAT 1624 

Qy 1459 GT CC GCAT AGAGGAGGAGC AGC CAGAGGAGGGGAT GCCT C CAGCAAT ATT CAACAGTCTT 1518 

III II II I I I I I I I I II I III I I I I I 

Db 1625 GTCAAAGTATCTT CTGAAGCTTCAGAAGAT GGCAT ACT GGAAGC CAATCAT 1675 

Qy 1519 CCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGAT 1578 

I II I II II I I I I I I I I I I I I I I I I II I I II I I I I 

Db 1676 GTTTCTACACTTGCTTGCCTCGGATCTCCCTCCACTGCCACTGTAACTATTTTTGATGAT 1735 

Qy 1579 GAC CAT GCAGGCAT CTT CACTTTT GAATGT GATACTATTCATGTCAGTGAGAGTATTGGT 1638 

Mill II I I I I I I II II I I II M I I I I II I I I I I M I I I I II I I 

Db 1736 GAC C ACGCAGGC AT TT T T ACTT TT GAGGAAC CT GT GACT CAT GTGAGT GAGAGCAT TGGC 1795 

Qy 1639 GTT AT GGAGGT CAAGGT T CTGC GGACATCAGGT GC CCGGGGTACAGT CAT C GT C C CCTTT 1698 

I II II I I II II II I I I I II I I II M I I II I II II II I II I I 
Db 1796 AT CAT GGAGGT GAAAGT ATTGAGAAC ATCT GGAGCTCGAGGAAAT GT TAT C GTT C CAT AT 1855 

Qy 1699 AGGACAGT AGAAGGGAC AGCCAAGGGT GGC GGT GAGGACTT T GAAGACAC AT AT GGGGAG 1758 

I II I I II II I II I I I I I I II I I I I II II I II II II I M I I M II I 
Db 1856 AAAACC AT C GAAGGGACT GCCAGAGGT GGAGGGGAGGAT TT T GAGGACACT T GT GGAGAG 1915 

Qy 1759 TTGGAATTCAAGAATGATGAAACTGT 1784 

I II II I I I I I II II I II II III 
Db 1916 CTCGAAT T CC AGAAT GAT GAAATT GT 1941 
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